CN112015529B - 数据任务调度方法、系统、电子设备及存储介质 - Google Patents

数据任务调度方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN112015529B
CN112015529B CN202010780876.8A CN202010780876A CN112015529B CN 112015529 B CN112015529 B CN 112015529B CN 202010780876 A CN202010780876 A CN 202010780876A CN 112015529 B CN112015529 B CN 112015529B
Authority
CN
China
Prior art keywords
data task
data
task
production
tasks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010780876.8A
Other languages
English (en)
Other versions
CN112015529A (zh
Inventor
景小琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202010780876.8A priority Critical patent/CN112015529B/zh
Publication of CN112015529A publication Critical patent/CN112015529A/zh
Application granted granted Critical
Publication of CN112015529B publication Critical patent/CN112015529B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/544Buffers; Shared memory; Pipes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例涉及一种数据任务调度方法、系统、电子设备及存储介质,方法包括:接收数据任务处理请求;基于所述数据任务处理请求创建至少一个数据任务;将至少一个所述数据任务存入生产缓冲区;在确定满足数据任务执行条件时,从所述生产缓冲区中获取所述数据任务,以及执行获取的所述数据任务。由此,可以实现简化数据任务调度系统的架构,使得数据任务调度系统能够便捷地接入业务系统,从而适用于敏捷开发的业务场景,同时可以简化数据任务调度方式。

Description

数据任务调度方法、系统、电子设备及存储介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种数据任务调度方法、系统、电子设备及存储介质。
背景技术
随着互联网业务的不断发展,业务系统经常需要处理批量的数据任务,如何让大量的数据任务准确完成调度而不出现问题则成为研发热点。
在敏捷开发中,软件项目在构建初期被切分成多个相关联系,但也可独立运行的子项目,各个子项目分别完成,并且各个子项目的成果都经过测试,具备可集成和可运行使用的特征。基于此,在敏捷开发业务场景下,将业务系统和数据任务调度系统分别完成,之后将数据任务调度系统接入业务系统,以满足业务系统处理批量数据任务的需求。
然而,目前主流的数据任务调度系统采用以下框架:xxl job、Azkaban、cronta、elastic Job、等等。这些数据任务调度框架本身架构比较复杂,将其接入业务系统的过程也比较复杂,因此,目前的数据任务调度系统并不适合用在敏捷开发业务场景下。
发明内容
鉴于此,本发明实施例提供一种数据任务调度方法、系统、电子设备及存储介质,以解决现有的数据任务调度系统不适合用在敏捷开发业务场景下的技术问题。
第一方面,本发明实施例提供一种数据任务调度方法,所述方法包括:
接收数据任务处理请求;
基于所述数据任务处理请求创建至少一个数据任务;
将至少一个所述数据任务存入生产缓冲区;
在确定满足数据任务执行条件时,从所述生产缓冲区中获取所述数据任务,以及执行获取的所述数据任务。
在一个可能的实施方式中,所述生产缓冲区的数量为多个,多个所述生产缓冲区的类型各不相同;
所述将至少一个数据任务存入生产缓冲区,包括:
根据所述数据任务的数量从多个所述生产缓冲区中确定目标缓冲区;
将至少一个所述数据任务存入所述目标缓冲区。
在一个可能的实施方式中,多个所述生产缓冲区至少包括:
RMQ消息队列、Redis阻塞队列。
在一个可能的实施方式中,在所述将至少一个数据任务存入生产缓冲区之后,还包括:
将预设的状态标志位设为第一值,以表示至少一个所述数据任务的任务状态为执行中;
所述确定满足数据任务执行条件,包括:
在确定所述生产缓冲区中存有所述数据任务且所述状态标志位为所述第一值时,确定满足数据任务执行条件。
在一个可能的实施方式中,所述方法还包括:
在接收到数据任务暂停执行请求时,将所述状态标志位设为第二值,以表示至少一个所述数据任务的任务状态为暂停执行。
在一个可能的实施方式中,所述方法还包括:
在接收到数据任务终止执行请求时,或者在确定所述生产缓冲区中不存有所述数据任务时,将所述状态标志位设为第三值,以表示至少一个所述数据任务的任务状态为终止执行。
第二方面,本发明实施例提供一种数据任务调度方法,应用于视频打标签场景,所述方法包括:
接收数据任务处理请求,所述数据任务处理请求携带视频筛选条件;
从视频库中确定至少一个与所述视频筛选条件相匹配的目标视频;
将至少一个所述目标视频存入生产缓冲区;
在确定满足数据任务执行条件时,从所述生产缓冲区中获取所述目标视频,以及基于预设的视频打标签业务逻辑对获取的所述目标视频进行打标签处理。
在一个可能的实施方式中,所述生产缓冲区的数量为多个,多个所述生产缓冲区的类型各不相同;
所述将至少一个目标视频存入生产缓冲区,包括:
根据所述目标视频的数量从多个所述生产缓冲区中确定目标缓冲区;
将至少一个所述目标视频存入所述目标缓冲区。
在一个可能的实施方式中,多个所述生产缓冲区至少包括:
RMQ消息队列、Redis阻塞队列。
在一个可能的实施方式中,在所述将至少一个目标视频存入生产缓冲区之后,还包括:
将预设的状态标志位设为第一值,以表示当前视频打标签任务的任务状态为执行中;
所述确定满足数据任务执行条件,包括:
在确定所述生产缓冲区中存有所述目标视频且所述状态标志位为所述第一值时,确定满足数据任务执行条件。
在一个可能的实施方式中,所述方法还包括:
在接收到数据任务暂停执行请求时,将所述状态标志位设为第二值,以表示当前视频打标签任务的任务状态为暂停执行。
在一个可能的实施方式中,所述方法还包括:
在接收到数据任务终止执行请求时,或者在确定所述生产缓冲区中不存有所述目标视频时,将所述状态标志位设为第三值,以表示当前视频打标签任务的任务状态为终止执行。
第三方面,本发明实施例提供一种数据任务调度系统,所述系统包括:生产者模块、消费者模块,以及生产缓冲区;
所述生产者模块,接收数据任务处理请求;基于所述数据任务处理请求创建至少一个数据任务;以及将至少一个所述数据任务存入所述生产缓冲区;
所述消费者模块,在确定满足数据任务执行条件时,从所述生产缓冲区中获取所述数据任务,以及执行获取的所述数据任务。
在一可能的实施方式中,所述生产缓冲区的数量为多个,多个所述生产缓冲区的类型各不相同;
所述生产者模块将至少一个数据任务存入生产缓冲区,包括:
根据所述数据任务的数量从多个所述生产缓冲区中确定目标缓冲区;
将至少一个所述数据任务存入所述目标缓冲区。
在一可能的实施方式中,多个所述生产缓冲区至少包括:
RMQ消息队列、Redis阻塞队列。
在一可能的实施方式中,所述系统还包括:
状态位设置模块,用于在所述生产者模块将至少一个数据任务存入生产缓冲区之后,将预设的状态标志位设为第一值,以表示至少一个所述数据任务的任务状态为执行中;
所述消费者模块确定满足数据任务执行条件,包括:
在确定所述生产缓冲区中存有所述数据任务且所述状态标志位为所述第一值时,确定满足数据任务执行条件。
在一可能的实施方式中,所述状态位设置模块还用于:
在接收到数据任务暂停执行请求时,将所述状态标志位设为第二值,以表示至少一个所述数据任务的任务状态为暂停执行;
在接收到数据任务终止执行请求时,将所述状态标志位设为第三值,以表示至少一个所述数据任务的任务状态为终止执行。
在一可能的实施方式中,所述消费者模块还用于:
在确定所述生产缓冲区中不存有所述数据任务时,将所述状态标志位设为第三值,以表示至少一个所述数据任务的任务状态为终止执行。
第四方面,本发明实施例提供一种数据任务调度系统,应用于视频打标签场景,所述系统包括:生产者模块、消费者模块,以及生产缓冲区;
所述生产者模块,接收数据任务处理请求,所述数据任务处理请求携带视频筛选条件;从视频库中确定至少一个与所述视频筛选条件相匹配的目标视频;以及将至少一个所述目标视频存入所述生产缓冲区;
所述消费者模块,在确定满足数据任务执行条件时,从所述生产缓冲区中获取所述目标视频,以及基于预设的视频打标签业务逻辑对获取的所述目标视频进行打标签处理。
在一可能的实施方式中,所述生产缓冲区的数量为多个,多个所述生产缓冲区的类型各不相同;
所述生产者模块将至少一个目标视频存入生产缓冲区,包括:
根据所述目标视频的数量从多个所述生产缓冲区中确定目标缓冲区;将至少一个所述目标视频存入所述目标缓冲区。
在一可能的实施方式中,多个所述生产缓冲区至少包括:
RMQ消息队列、Redis阻塞队列。
在一可能的实施方式中,所述系统还包括:
状态位设置模块,用于在所述生产者模块将至少一个目标视频存入生产缓冲区之后,将预设的状态标志位设为第一值,以表示当前视频打标签任务的任务状态为执行中;
所述消费者模块确定满足数据任务执行条件,包括:
在确定所述生产缓冲区中存有所述目标视频且所述状态标志位为所述第一值时,确定满足数据任务执行条件。
在一可能的实施方式中,所述状态位设置模块还用于:
在接收到数据任务暂停执行请求时,将所述状态标志位设为第二值,以表示当前视频打标签任务的任务状态为暂停执行;
在接收到数据任务终止执行请求时,将所述状态标志位设为第三值,以表示当前视频打标签任务的任务状态为终止执行。
在一可能的实施方式中,所述消费者模块还用于:
在确定所述生产缓冲区中不存有所述目标视频时,将所述状态标志位设为第三值,以表示当前视频打标签任务的任务状态为终止执行。
第五方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的数据任务调度程序,以实现上述第一方面或第二方面中任一项所述的数据任务调度方法。
第六方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面或第二方面中任一项所述的数据任务调度方法。
本发明实施例提供的数据任务调度方法,通过接收数据任务处理请求,基于数据任务处理请求创建至少一个数据任务,将至少一个数据任务存入生产缓冲区,在确定满足数据任务执行条件时,从生产缓冲区中获取所述数据任务,以及执行获取的数据任务,实现了采用生产者-消费者模式实现数据任务调度。
进一步,相较于目前主流的数据任务调度框架,采用生产者-消费者模式实现的数据任务调度系统架构简单,可便捷地接入业务系统,因此可适用于敏捷开发的业务场景,同时,可以简化数据任务调度方式。
附图说明
图1为本发明实施例提供的数据任务调度系统的架构图;
图2为本发明实施例提供的一种数据任务调度方法的实施例流程图;
图3为本发明实施例提供的另一种数据任务调度方法的实施例流程图;
图4为本发明实施例提供的一种的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
参见图1,为本发明实施例提供的数据任务调度系统的架构图。如图1所示,数据任务调度系统100包括:生产者模块101、消费者模块102~104、生产缓冲区105~106,以及状态位设置模块107。需要说明的是,这里所说的模块是广义的,可以是类、函数、线程、进程等。
其中,生产者模块101负责创建数据任务,消费者模块102~104则负责处理数据任务。需要说明的是,图1中所示例的生产者模块和消费者模块的数量仅仅作为举例,并非用作限定,在实际应用中,数据任务调度系统100可以包括一个消费者模块或者多个消费者模块,也可以包括多个生产者模块。
生产缓冲区105~106处于生产者模块101和消费者模块102~104之间,作为一个中介,由生产者模块101将创建的数据任务放入生产缓冲区105或106,而消费者模块102~104则从生产缓冲区105或106中取出数据任务。
在一实施例中,生产缓冲区105~106的类型不相同。在一个例子中,生产缓冲区105为RMQ消息队列,生产缓冲区106为Redis阻塞队列。其中,RMQ消息队列属于第三方中间件,具有吞吐量大、几乎不占用系统内存、高可靠性等优点,同时也具有开销过大,增加系统复杂度的缺点;Redis阻塞队列则具有数据可实时查询、使用方式简单等优点,同时也具有当存储的数据量过大时,占用内存过大的缺点。
需要说明的是,图1中仅以两个生产缓冲区为例,在实际应用中,数据任务调度系统100可包括一个或多个生产缓冲区。可选的,在数据任务调度系统100包括多个生产缓冲区的情况下,多个生产缓冲区的类型各不相同。
状态位设置模块107则用于设置用于表示数据任务状态(以下称任务状态)的状态标志位。至于状态标志位的具体含义以及设置原则,在下文实施例中会有描述,这里先不详述。
以上对图1所示数据任务调度系统100的架构进行了描述。下面则结合图1所示例的数据任务调度系统100,对本发明实施例提供的数据任务调度方法以及数据任务调度系统100中各模块的功能进行说明。
参见图2,为本发明实施例提供的一种数据任务调度方法的实施例流程图,在一个例子中,该方法应用于数据任务调度系统,比如图1中所示例的数据任务调度系统100。如图2所示,该方法包括以下步骤:
步骤201、接收数据任务处理请求。
数据任务处理请求可指示出具体的任务内容,还可携带一些任务信息,比如任务名称、任务开始时间、任务数量等等,本发明实施例对此不做限定。
步骤202、基于数据任务处理请求创建至少一个数据任务。
步骤203、将至少一个数据任务存入生产缓冲区。
基于图1所示例的数据任务调度系统100,可由生产者模块101接收数据任务处理请求,基于数据任务处理请求创建至少一个数据任务,以及将至少一个数据任务存入生产缓冲区。
在一实施例中,生产者模块101可每创建出一个数据任务,则将该数据任务存入生产缓冲区。
在一实施例中,生产者模块101可将创建出的所有数据任务,批量存入生产缓冲区。
进一步,在数据任务调度系统包括多个生产缓冲区,且多个生产缓冲区的类型各不相同的情况下,由于不同类型的生产缓冲区具有不同的优缺点,因此,在一实施例中,生产者模块101可从数据任务调度系统的多个生产缓冲区中选择一个合适的生产缓冲区(以下称目标缓冲区),将步骤202创建的数据任务存入该目标缓冲区。
作为一个可选的实现方式,生产者模块100根据步骤202创建的数据任务的数量,从数据任务调度系统的多个生产缓冲区中确定目标缓冲区。
举例来说,若数据任务的数量超过设定阈值,比如10万,则将生产缓冲区105,即,RMQ消息队列确定为目标缓冲区,这能够实现在数据任务量过大时,也能够较少地占用系统内存。而若数据任务的数量未超过设定阈值,则将生产缓冲区106,即,Redis阻塞队列确定为目标缓冲区,这能够实现实时进行数据查询。
步骤204、在确定满足数据任务执行条件时,从生产缓冲区中获取数据任务,以及执行获取的数据任务。
在本发明实施例中,为了满足用户能够管理、控制数据任务的任务状态的需求,维护一个状态标志位的概念,状态标志位可以表示数据任务的任务状态,通过状态标志位的变更还可实现数据任务的任务状态变更。
在一实施例中,数据任务的任务状态包括以下四种:初始化(即创建过程中)、执行中、暂停执行、终止执行。基于此,状态标志位也将具有四种取值,比如00、01、10、11。可以理解的是,该四种取值分别与以上四种任务状态相对应。
在一个例子中,为了描述方便,将上述四种取值分别称为第一值、第二值、第三值、第四值。其中,状态标志位为第一值时,表示数据任务的任务状态为执行中;状态标志位为第二值时,表示数据任务的任务状态为暂停执行,状态标志位为第三值时,表示数据任务的任务状态为终止执行,状态标志位为第四值,表示数据任务的任务状态为初始化。
基于上述描述,在一实施例中,状态位设置模块107在接收到数据任务处理请求时,则将任务状态标志位设置第四值,以表示数据任务的任务状态为初始化;在生产者模块101将创建出的至少一个数据任务存入生产缓冲区之后,则将任务状态标志位设置第一值,以表示数据任务的任务状态为执行中;状态位设置模块107还在接收到数据任务暂停执行请求时,则将状态标志位设为第二值,以表示数据任务的任务状态为暂停执行;在接收到数据任务终止执行请求时,将状态标志位设为第三值,以表示数据任务的任务状态为终止执行。
此外,在确定所有数据任务执行完毕时,也可将状态标志位设为第三值,以表示数据任务的任务状态为终止执行。可以理解的是,只有在生产缓冲区中存在数据任务,且数据任务的任务状态为执行中时,才涉及到执行数据任务。因此,本步骤204中,消费者模块确定满足数据任务执行条件包括:在确定生产缓冲区中存有数据任务且状态标志位为第一值时,确定满足数据任务执行条件。由此可见,本发明实施例中,通过维护一个状态标志位来表示数据任务的任务状态,可以实现根据状态标志位控制数据任务的执行。
进一步,消费者模块在确定满足数据任务执行条件时,可从生产缓冲区中获取数据任务,以及执行获取的数据任务。其中,对于任一消费者模块,其可以一次从生产缓冲区中获取一个或多个数据任务,并且,消费者模块在执行完获取的数据任务之后,才会再次从生产缓冲区中获取数据任务。这也就是说,当任一消费者模块发现生产缓冲区中不存有数据任务时,则可以确定数据任务执行完毕,此时,该任一消费者模块可将状态标志位设为第三值,以表示数据任务的任务状态为终止执行。
至此,完成图2所示流程的说明。
本发明实施例提供的数据任务调度方法,通过接收数据任务处理请求,基于数据任务处理请求创建至少一个数据任务,将至少一个数据任务存入生产缓冲区,在确定满足数据任务执行条件时,从生产缓冲区中获取所述数据任务,以及执行获取的数据任务,实现了采用生产者-消费者模式实现数据任务调度。
进一步,相较于目前主流的数据任务调度框架,采用生产者-消费者模式实现的数据任务调度系统架构简单,可便捷地接入业务系统,因此可适用于敏捷开发的业务场景,同时,可以简化数据任务调度方式。
为了更好地理解本发明实施例提供的数据任务调度方法,以下结合具体的应用场景对该方法做进一步说明:
在现有的视频搜索或视频推荐中,通常都是通过视频打标签技术给视频资源打上对应的标签,然后基于标签对视频进行推荐,或者基于标签建立索引,实现视频的搜索。在视频打标签场景下,存在一种对一批视频进行打标签的需求,这时,对一个视频进行打标签的业务逻辑则可看做一个数据任务。以下则通过图3所示流程,对视频打标签场景下,本发明实施例提供的数据任务调度方法进行说明:
参见图3,为本发明实施例提供的另一种数据任务调度方法的实施例流程图。如图3所示,包括以下步骤:
步骤301、接收数据任务处理请求,数据任务处理请求携带视频筛选条件。
在视频打标签场景下,数据任务处理请求所指示的任务内容为:对符合条件的视频执行打标签业务逻辑。基于此,在一实施例中,数据任务处理请求携带视频筛选条件。
在实际业务应用中,可从多个维度对视频进行筛选,比如,按照视频发布地、视频类型、视频作者、视频发布时间、视频播放次数、视频评论条数等维度对视频进行筛选。视频筛选条件则用于指示视频筛选维度,比如,视频筛选条件用于指示筛选出“某某”发布的视频。
步骤302、从视频库中确定至少一个与视频筛选条件相匹配的目标视频。
步骤303、将至少一个目标视频存入生产缓冲区。
基于图1所示例的数据任务调度系统100,可由生产者模块101接收数据任务处理请求,从视频库中确定至少一个与视频筛选条件相匹配的视频(以下称目标视频),以及将目标视频存入生产缓冲区。
在一实施例中,生产者模块101可每筛选出一个目标视频,则将该目标视频存入生产缓冲区。
在另一实施例中,生产者模块101可在筛选完毕之后,将筛选出的所有目标视频批量存入生产缓冲区。
进一步,在数据任务调度系统包括多个生产缓冲区,且多个生产缓冲区的类型各不相同的情况下,生产者模块101可从数据任务调度系统的多个生产缓冲区中选择一个合适的生产缓冲区(以下称目标缓冲区),将筛选出的目标视频存入该目标缓冲区。
作为一个可选的实现方式,生产者模块100根据步骤302筛选出的目标视频的数量,从数据任务调度系统的多个生产缓冲区中确定目标缓冲区。
举例来说,若目标视频的数量超过设定阈值,比如10万,则将生产缓冲区105,即,RMQ消息队列确定为目标缓冲区,这能够实现在视频打标签任务量过大时,也能够较少地占用系统内存。而若目标视频的数量未超过设定阈值,则将生产缓冲区106,即,Redis阻塞队列确定为目标缓冲区,这能够实现实时进行数据查询。
步骤304、在确定满足数据任务执行条件时,从生产缓冲区中获取目标视频,以及基于预设的视频打标签业务逻辑对获取的目标视频进行打标签处理。
基于上述步骤204中的描述,在本步骤304中,消费者模块可在确定生产缓冲区中存有数据任务且状态标志位为第一值时,确定满足数据任务执行条件,并在确定满足数据任务执行条件时,从生产缓冲区中获取目标视频,以及基于预设的视频打标签业务逻辑对获取的目标视频进行打标签处理。
至于状态标志位的设置原理及过程,可参见上述步骤204中的描述,这里不再详述。
至此,完成图3所示流程的说明。
在本发明实施例中,通过在视频打标签场景下应用本发明实施例提供的数据任务调度方法,可以简化视频打标签任务的调度方式。
图4为本发明实施例提供的一种的电子设备的结构示意图,图4所示的电子设备400包括:至少一个处理器401、存储器402、至少一个网络接口404和其他用户接口403。电子设备400中的各个组件通过总线系统405耦合在一起。可理解,总线系统405用于实现这些组件之间的连接通信。总线系统405除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图4中将各种总线都标为总线系统405。
其中,用户接口403可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
可以理解,本发明实施例中的存储器402可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器(ProgrammableROM,PROM)、可擦除可编程只读存储器(ErasablePROM,EPROM)、电可擦除可编程只读存储器(ElectricallyEPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(RandomAccessMemory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(StaticRAM,SRAM)、动态随机存取存储器(DynamicRAM,DRAM)、同步动态随机存取存储器(SynchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(DoubleDataRateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(SynchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambusRAM,DRRAM)。本文描述的存储器402旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器402存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统4021和应用程序4022。
其中,操作系统4021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序4022,包含各种应用程序,例如媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序4022中。
在本发明实施例中,通过调用存储器402存储的程序或指令,具体的,可以是应用程序4022中存储的程序或指令,处理器401用于执行各方法实施例所提供的方法步骤,例如包括:
接收数据任务处理请求;
基于所述数据任务处理请求创建至少一个数据任务;
将至少一个所述数据任务存入生产缓冲区;
在确定满足数据任务执行条件时,从所述生产缓冲区中获取所述数据任务,以及执行获取的所述数据任务。
或者,接收数据任务处理请求,所述数据任务处理请求携带视频筛选条件;
从视频库中确定至少一个与所述视频筛选条件相匹配的目标视频;
将至少一个所述目标视频存入生产缓冲区;
在确定满足数据任务执行条件时,从所述生产缓冲区中获取所述目标视频,以及基于预设的视频打标签业务逻辑对获取的所述目标视频进行打标签处理。
上述本发明实施例揭示的方法可以应用于处理器401中,或者由处理器401实现。处理器401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器401可以是通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(FieldProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器402,处理器401读取存储器402中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecificIntegratedCircuits,ASIC)、数字信号处理器(DigitalSignalProcessing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(ProgrammableLogicDevice,PLD)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本实施例提供的电子设备可以是如图4中所示的电子设备,可执行如图2-3中数据任务调度方法的所有步骤,进而实现图2-3所示数据任务调度方法的技术效果,具体请参照图2-3相关描述,为简洁描述,在此不作赘述。
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在电子设备侧执行的自动打版方法。
所述处理器用于执行存储器中存储的数据任务调度程序,以实现以下在电子设备侧执行的数据任务调度方法的步骤:
接收数据任务处理请求;
基于所述数据任务处理请求创建至少一个数据任务;
将至少一个所述数据任务存入生产缓冲区;
在确定满足数据任务执行条件时,从所述生产缓冲区中获取所述数据任务,以及执行获取的所述数据任务。
或者,接收数据任务处理请求,所述数据任务处理请求携带视频筛选条件;
从视频库中确定至少一个与所述视频筛选条件相匹配的目标视频;
将至少一个所述目标视频存入生产缓冲区;
在确定满足数据任务执行条件时,从所述生产缓冲区中获取所述目标视频,以及基于预设的视频打标签业务逻辑对获取的所述目标视频进行打标签处理。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种数据任务调度方法,其特征在于,所述方法包括:
接收数据任务处理请求;
基于所述数据任务处理请求创建至少一个数据任务;
将至少一个所述数据任务存入生产缓冲区;
在确定满足数据任务执行条件时,从所述生产缓冲区中获取所述数据任务,以及执行获取的所述数据任务;
其中,所述生产缓冲区的数量为多个,多个所述生产缓冲区的类型各不相同,多个所述生产缓冲区至少包括:RMQ消息队列、Redis阻塞队列;
所述将至少一个数据任务存入生产缓冲区,包括:
若创建的所述数据任务的数量超过设定阈值,则将创建的所述数据任务存入RMQ消息队列;
若创建的所述数据任务的数量未超过设定阈值,则将创建的所述数据任务存入Redis阻塞队列。
2.根据权利要求1所述的方法,其特征在于,在所述将至少一个数据任务存入生产缓冲区之后,还包括:
将预设的状态标志位设为第一值,以表示至少一个所述数据任务的任务状态为执行中;
所述确定满足数据任务执行条件,包括:
在确定所述生产缓冲区中存有所述数据任务且所述状态标志位为所述第一值时,确定满足数据任务执行条件。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在接收到数据任务暂停执行请求时,将所述状态标志位设为第二值,以表示至少一个所述数据任务的任务状态为暂停执行。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在接收到数据任务终止执行请求时,或者在确定所述生产缓冲区中不存有所述数据任务时,将所述状态标志位设为第三值,以表示至少一个所述数据任务的任务状态为终止执行。
5.一种数据任务调度系统,其特征在于,所述系统包括:生产者模块、消费者模块,以及生产缓冲区;
所述生产者模块,接收数据任务处理请求;基于所述数据任务处理请求创建至少一个数据任务;以及将至少一个所述数据任务存入所述生产缓冲区;
所述消费者模块,在确定满足数据任务执行条件时,从所述生产缓冲区中获取所述数据任务,以及执行获取的所述数据任务;
其中,所述生产缓冲区的数量为多个,多个所述生产缓冲区的类型各不相同,多个所述生产缓冲区至少包括:RMQ消息队列、Redis阻塞队列;
所述生产者模块,在将至少一个所述数据任务存入所述生产缓冲区时,具体用于若创建的所述数据任务的数量超过设定阈值,则将创建的所述数据任务存入RMQ消息队列;若创建的所述数据任务的数量未超过设定阈值,则将创建的所述数据任务存入Redis阻塞队列。
6.根据权利要求5所述的系统,其特征在于,所述系统还包括:
状态位设置模块,在所述生产者模块将至少一个数据任务存入生产缓冲区之后,将预设的状态标志位设为第一值,以表示至少一个所述数据任务的任务状态为执行中;
所述消费者模块确定满足数据任务执行条件,包括:
所述消费者模块在确定所述生产缓冲区中存有所述数据任务且所述状态标志位为所述第一值时,确定满足数据任务执行条件。
7.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的数据任务调度程序,以实现权利要求1~4任一项所述的数据任务调度方法。
8.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1~4任一项所述的数据任务调度方法。
CN202010780876.8A 2020-08-05 2020-08-05 数据任务调度方法、系统、电子设备及存储介质 Active CN112015529B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010780876.8A CN112015529B (zh) 2020-08-05 2020-08-05 数据任务调度方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010780876.8A CN112015529B (zh) 2020-08-05 2020-08-05 数据任务调度方法、系统、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112015529A CN112015529A (zh) 2020-12-01
CN112015529B true CN112015529B (zh) 2023-09-01

Family

ID=73500139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010780876.8A Active CN112015529B (zh) 2020-08-05 2020-08-05 数据任务调度方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112015529B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732429A (zh) * 2021-01-18 2021-04-30 国汽智控(北京)科技有限公司 任务调度的方法、装置、设备及存储介质
CN113608899B (zh) * 2021-10-08 2021-12-17 创智和宇信息技术股份有限公司 轻量级数据生产-消费者模式处理方法、系统及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107819699A (zh) * 2017-10-31 2018-03-20 普天东方通信集团有限公司 一种数据业务的处理方法及系统
CN109144696A (zh) * 2018-08-30 2019-01-04 百度在线网络技术(北京)有限公司 一种任务调度方法、装置、电子设备及存储介质
CN109933420A (zh) * 2019-04-02 2019-06-25 深圳市网心科技有限公司 节点任务调度方法、电子设备及系统
CN110402430A (zh) * 2017-04-07 2019-11-01 欧姆龙株式会社 控制装置、控制方法以及控制程序
CN110515749A (zh) * 2019-08-30 2019-11-29 深圳乐信软件技术有限公司 信息发送的队列调度的方法、装置、服务器和存储介质
CN110808922A (zh) * 2019-10-29 2020-02-18 北京大米科技有限公司 一种消息处理方法、装置、存储介质及电子设备
CN111045807A (zh) * 2019-12-17 2020-04-21 深圳前海环融联易信息科技服务有限公司 基于zookeeper任务处理的方法、装置、计算机设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7669081B2 (en) * 2006-09-27 2010-02-23 Raytheon Company Systems and methods for scheduling, processing, and monitoring tasks
US8190624B2 (en) * 2007-11-29 2012-05-29 Microsoft Corporation Data parallel production and consumption
AU2014268246A1 (en) * 2014-11-28 2016-06-16 Canon Kabushiki Kaisha Reverting tightly coupled threads in an over-scheduled system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110402430A (zh) * 2017-04-07 2019-11-01 欧姆龙株式会社 控制装置、控制方法以及控制程序
CN107819699A (zh) * 2017-10-31 2018-03-20 普天东方通信集团有限公司 一种数据业务的处理方法及系统
CN109144696A (zh) * 2018-08-30 2019-01-04 百度在线网络技术(北京)有限公司 一种任务调度方法、装置、电子设备及存储介质
CN109933420A (zh) * 2019-04-02 2019-06-25 深圳市网心科技有限公司 节点任务调度方法、电子设备及系统
CN110515749A (zh) * 2019-08-30 2019-11-29 深圳乐信软件技术有限公司 信息发送的队列调度的方法、装置、服务器和存储介质
CN110808922A (zh) * 2019-10-29 2020-02-18 北京大米科技有限公司 一种消息处理方法、装置、存储介质及电子设备
CN111045807A (zh) * 2019-12-17 2020-04-21 深圳前海环融联易信息科技服务有限公司 基于zookeeper任务处理的方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN112015529A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN112015529B (zh) 数据任务调度方法、系统、电子设备及存储介质
US20220236911A1 (en) Data streaming for computational storage
CN114490566B (zh) 集群数据迁移方法、装置、计算机设备及存储介质
CN105786603A (zh) 一种基于分布式的高并发业务处理系统及方法
CN114168271B (zh) 一种任务调度方法、电子设备及存储介质
EP0790557A2 (en) Task managemant apparatus
US20170147398A1 (en) Estimating job start times on workload management systems
CN108804563B (zh) 一种数据标注方法、装置以及设备
CN115099352A (zh) 模型训练系统、模型训练方法及装置
CN110569887A (zh) 基于预测层特征增强的目标检测方法、存储介质及设备
CN112948136A (zh) 一种嵌入式操作系统异步日志记录的实现方法
US10198784B2 (en) Capturing commands in a multi-engine graphics processing unit
US11481250B2 (en) Cooperative workgroup scheduling and context prefetching based on predicted modification of signal values
CN115576685A (zh) 容器的调度方法、装置及计算机设备
US20120159247A1 (en) Automatically changing parts in response to tests
CN111050179A (zh) 一种视频转码方法及装置
US10552760B2 (en) Training set creation for classifying features of a system under agile development
CN110147515A (zh) 网页的访问方法及装置
US20230297632A1 (en) Fetching a query result using a query filter
US11481130B2 (en) Method, electronic device and computer program product for processing operation commands
US9251100B2 (en) Bitmap locking using a nodal lock
CN114979131B (zh) 面向云计算的标签化冯诺依曼体系结构通信方法及装置
CN117130787A (zh) 资源调度方法、装置、电子设备及存储介质
US20230315454A1 (en) Fusing no-op (nop) instructions
CN111930781A (zh) 对缓存数据库的数据请求的处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant