WO2020248708A1 - 一种Spark作业的提交方法及装置 - Google Patents
一种Spark作业的提交方法及装置 Download PDFInfo
- Publication number
- WO2020248708A1 WO2020248708A1 PCT/CN2020/085217 CN2020085217W WO2020248708A1 WO 2020248708 A1 WO2020248708 A1 WO 2020248708A1 CN 2020085217 W CN2020085217 W CN 2020085217W WO 2020248708 A1 WO2020248708 A1 WO 2020248708A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- spark
- job
- execution
- node
- spark job
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/546—Message passing systems or structures, e.g. queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/54—Indexing scheme relating to G06F9/54
- G06F2209/548—Queue
Abstract
Description
Claims (11)
- 一种Spark作业的提交方法,其特征在于,包括:接收Spark作业的执行请求;根据所述执行请求,获取Yarn集群的节点黑名单;所述节点黑名单是监控告警平台生成的记录有所述Yarn集群中不可用的执行节点的名单;根据所述执行请求中所述Spark作业的作业参数、所述Yarn集群的节点黑名单,创建Spark引擎,通过所述Spark引擎将所述Spark作业发送至所述Yarn集群。
- 如权利要求1所述的方法,其特征在于,所述方法还包括:根据所述执行请求,获取所述Yarn集群中所述Spark作业的目标队列的资源使用情况;所述根据所述执行请求中所述Spark作业的作业参数、所述Yarn集群的节点黑名单,创建Spark引擎,通过所述Spark引擎将所述Spark作业发送至所述Yarn集群,包括:根据所述节点黑名单删除所述Yarn集群中所述不可用的执行节点;从所述Spark作业的目标队列中确定出用于执行所述Spark作业的第一资源队列,并结合所述执行请求中所述Spark作业的作业参数创建Spark引擎,通过所述Spark引擎将所述Spark作业发送至所述第一资源队列。
- 如权利要求2所述的方法,其特征在于,还包括:获取所述Spark作业在所述第一资源队列中的执行信息;在确定所述Spark作业执行失败后,根据所述执行信息,确定所述Spark作业的错误代码,并调整所述Spark作业的作业参数;根据调整后的作业参数,重新生成所述Spark作业并发送至所述第一资源队列。
- 如权利要求3所述的方法,其特征在于,所述Spark作业的作业参数包括:所述Spark作业执行过程中的执行节点的个数、各所述执行节点的内存、网络延时参数、各任务的失败重试数。
- 一种Spark作业的提交装置,其特征在于,包括:收发单元,用于接收Spark作业的执行请求;处理单元,用于根据所述执行请求,获取Yarn集群的节点黑名单;所述节点黑名单是监控告警平台生成的记录有所述Yarn集群中不可用的执行节点的名单;根据所述执行请求中所述Spark作业的作业参数、所述Yarn集群的节点黑名单,创建Spark引擎,通过所述Spark引擎将所述Spark作业发送至所述Yarn集群。
- 如权利要求5所述的装置,其特征在于,所述处理单元还用于:根据所述执行请求,获取所述Yarn集群中所述Spark作业的目标队列的资源使用情况;所述处理单元具体用于:根据所述节点黑名单删除所述Yarn集群中所述不可用的执行节点;从所述Spark作业的目标队列中确定出用于执行所述Spark作业的第一资源队列,并结合所述执行请求中所述Spark作业的作业参数创建Spark引擎,通过所述Spark引擎将所述Spark作业发送至所述第一资源队列。
- 如权利要求6所述的装置,其特征在于,所述处理单元还用于:获取所述Spark作业在所述第一资源队列中的执行信息;在确定所述Spark作业执行失败后,根据所述执行信息,确定所述Spark作业的错误代码,并调整所述Spark作业的作业参数;根据调整后的作业参数,重新生成所述Spark作业并发送至所述第一资源队列。
- 如权利要求7所述的装置,其特征在于,所述Spark作业的作业参数包括:所述Spark作业执行过程中的执行节点的个数、各所述执行节点的内存、网络延时参数、各任务的失败重试数。
- 一种计算设备,其特征在于,包括:存储器,用于存储程序指令;处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1至4任一项所述的方法。
- 一种计算机可读非易失性存储介质,其特征在于,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行如权利要求1至4任一项所述的方法。
- 一种计算机程序产品,其特征在于,所述计算机程序产品包括存储在计算机可读非易失性存储介质上的计算程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行权利要求1~4任一所述方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910504561.8 | 2019-06-12 | ||
CN201910504561.8A CN110262881A (zh) | 2019-06-12 | 2019-06-12 | 一种Spark作业的提交方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2020248708A1 true WO2020248708A1 (zh) | 2020-12-17 |
Family
ID=67917731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2020/085217 WO2020248708A1 (zh) | 2019-06-12 | 2020-04-16 | 一种Spark作业的提交方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110262881A (zh) |
WO (1) | WO2020248708A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110262881A (zh) * | 2019-06-12 | 2019-09-20 | 深圳前海微众银行股份有限公司 | 一种Spark作业的提交方法及装置 |
CN112540858B (zh) * | 2019-09-23 | 2023-10-27 | 华为云计算技术有限公司 | 任务处理方法、服务器、客户端及系统 |
CN111031123B (zh) * | 2019-12-10 | 2022-06-03 | 中盈优创资讯科技有限公司 | Spark任务的提交方法、系统、客户端及服务端 |
CN111767092B (zh) * | 2020-06-30 | 2023-05-12 | 深圳前海微众银行股份有限公司 | 作业执行方法、装置、系统及计算机可读存储介质 |
CN112000734A (zh) * | 2020-08-04 | 2020-11-27 | 中国建设银行股份有限公司 | 一种大数据处理方法和装置 |
CN112328403A (zh) * | 2020-11-25 | 2021-02-05 | 北京中天孔明科技股份有限公司 | 一种SparkContext的配置方法、装置及服务端 |
CN112486468A (zh) * | 2020-12-15 | 2021-03-12 | 恩亿科(北京)数据科技有限公司 | 基于spark内核的任务执行方法、系统和计算机设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653928A (zh) * | 2016-02-03 | 2016-06-08 | 北京大学 | 一种面向大数据平台的拒绝服务检测方法 |
CN106980699A (zh) * | 2017-04-14 | 2017-07-25 | 中国科学院深圳先进技术研究院 | 一种数据处理平台和系统 |
CN110262881A (zh) * | 2019-06-12 | 2019-09-20 | 深圳前海微众银行股份有限公司 | 一种Spark作业的提交方法及装置 |
US20190370146A1 (en) * | 2018-06-05 | 2019-12-05 | Shivnath Babu | System and method for data application performance management |
-
2019
- 2019-06-12 CN CN201910504561.8A patent/CN110262881A/zh active Pending
-
2020
- 2020-04-16 WO PCT/CN2020/085217 patent/WO2020248708A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653928A (zh) * | 2016-02-03 | 2016-06-08 | 北京大学 | 一种面向大数据平台的拒绝服务检测方法 |
CN106980699A (zh) * | 2017-04-14 | 2017-07-25 | 中国科学院深圳先进技术研究院 | 一种数据处理平台和系统 |
US20190370146A1 (en) * | 2018-06-05 | 2019-12-05 | Shivnath Babu | System and method for data application performance management |
CN110262881A (zh) * | 2019-06-12 | 2019-09-20 | 深圳前海微众银行股份有限公司 | 一种Spark作业的提交方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110262881A (zh) | 2019-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020248708A1 (zh) | 一种Spark作业的提交方法及装置 | |
US11250025B2 (en) | Methods and systems for bulk uploading of data in an on-demand service environment | |
US10453010B2 (en) | Computer device, method, and apparatus for scheduling business flow | |
US10261853B1 (en) | Dynamic replication error retry and recovery | |
WO2021237829A1 (zh) | 一种实现代码仓库与计算服务整合的方法及系统 | |
US8365193B2 (en) | Recoverable asynchronous message driven processing in a multi-node system | |
US8166350B2 (en) | Apparatus and method for persistent report serving | |
US9495199B2 (en) | Management of bottlenecks in database systems | |
CN110806933B (zh) | 一种批量任务处理方法、装置、设备和存储介质 | |
CN112000455B (zh) | 一种多线程任务处理方法、装置及电子设备 | |
US11886284B2 (en) | System and method for data redistribution in a database | |
JP2008015888A (ja) | 負荷分散制御システム及び負荷分散制御方法 | |
CN111160873B (zh) | 基于分布式架构的跑批处理装置及方法 | |
CN110377402A (zh) | 业务数据处理方法、装置、存储介质及计算机设备 | |
US20140304306A1 (en) | Database Management System With Database Hibernation and Bursting | |
US20210073198A1 (en) | Using persistent memory and remote direct memory access to reduce write latency for database logging | |
US9984139B1 (en) | Publish session framework for datastore operation records | |
WO2019223174A1 (zh) | 任务自动重跑方法、系统、计算机设备和存储介质 | |
WO2020192065A1 (zh) | 一种跨集群高可用的实现方法、装置、系统及设备 | |
US9448827B1 (en) | Stub domain for request servicing | |
WO2021118624A1 (en) | Efficient transaction log and database processing | |
US20160328461A1 (en) | Idling individually specified objects during data replication | |
CN113157411B (zh) | 一种基于Celery的可靠可配置任务系统及装置 | |
CN112199432A (zh) | 一种基于分布式的高性能数据etl装置及控制方法 | |
CN116719623A (zh) | 作业调度方法、作业结果处理方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20823627 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20823627 Country of ref document: EP Kind code of ref document: A1 |
|
32PN | Ep: public notification in the ep bulletin as address of the adressee cannot be established |
Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205 DATED 21/03/2022) |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20823627 Country of ref document: EP Kind code of ref document: A1 |