CN106095535B - 一种支持多核平台下数据流处理的线程管理系统 - Google Patents

一种支持多核平台下数据流处理的线程管理系统 Download PDF

Info

Publication number
CN106095535B
CN106095535B CN201610404750.4A CN201610404750A CN106095535B CN 106095535 B CN106095535 B CN 106095535B CN 201610404750 A CN201610404750 A CN 201610404750A CN 106095535 B CN106095535 B CN 106095535B
Authority
CN
China
Prior art keywords
event
thread
request
queue
esper
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610404750.4A
Other languages
English (en)
Other versions
CN106095535A (zh
Inventor
王洪亚
刘杰
陆可镜
常姗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN201610404750.4A priority Critical patent/CN106095535B/zh
Publication of CN106095535A publication Critical patent/CN106095535A/zh
Application granted granted Critical
Publication of CN106095535B publication Critical patent/CN106095535B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/466Transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种支持多核平台下数据流处理的线程管理系统,其特征在于,包括线程池管理器、请求队列、事件队列及包含有多个线程的线程池。本发明的有益效果是:本发明解决了多核平台复杂查询中数据流处理的性能问题。本发明能够在不改变原有Esper内部代码与结构的前提下,只通过外加线程管理来管理查询线程,对Esper本身没有“污染”。与现有技术相比,本发明通过外加线程管理以适应多核平台复杂查询,具有事件查询吞吐量高,事件响应时间快等特点,进一步可以推广到其它类Esper引擎数据流查询工具。

Description

一种支持多核平台下数据流处理的线程管理系统
技术领域
本发明涉及一种适用于多核平台下Esper数据流处理引擎的线程管理系统。
背景技术
复杂事件处理(Complex Event Processing,CEP)是一种实时从大量事件数据流中挖掘复杂模式的技术。事件流处理(Event Stream Processing,ESP)是一种从大量事件数据流中过滤,分析有意义的事件,并能够实时取得信息的技术。CEP和ESP系统在流数据处理和实时响应方面非常出色。Esper是基于CEP(复杂事件处理)和ESP(事件流处理)应用程序的组件,可以监测事件流并在特定事件发生时触发某些动作执行。Esper引擎的出现是为了满足事件进行分析并做出反应等类似应用需求而产生的。此类应用要求实时或者接近实时地处理事件,这些应用具有高吞吐量、低响应时间和复杂计算等特点。
Esper官方性能数据显示,在双2GHz CPU的Intel系统测试环境下,处理速率超过500000个事件/秒;但是,这些测试只是针对一些相对简单的查询得到的统计结果,而在现实应用中,Esper处理的查询通常为较为复杂的查询而非简单查询。现实应用案例表明,Esper在多核平台下复杂查询中表现出来的性能并不能充分利用软、硬件资源。究其原因是Esper在多核平台下采用的线程管理设计中存在着不足而导致的。
发明内容
本发明要解决的技术问题是:让Esper充分利用多核平台的软硬件资源,提高查询效率以及提升事件处理能力。
为了解决上述技术问题,本发明的技术方案是提供了一种支持多核平台下数据流处理的线程管理系统,其特征在于,包括线程池管理器、请求队列、事件队列及包含有多个线程的线程池,其中:
事件队列,用于存入事件,每个事件均具有一个事件类型,不同事件队列对应不同的事件类型,事件抵达Esper引擎后,由线程池管理器接管Esper引擎原有的事件发送方法,将当前事件依据事件类型存入对应的事件队列中;
线程池中的线程的状态在休眠与唤醒之间切换:当线程池管理器初始化后,或当处于唤醒状态的线程无法申请到请求队列中的请求后,或当线程依据申请到的请求中包含的事件类型访问对应的事件队列,而对应的事件队列为空时,线程的状态变更为休眠;
当请求被创建并插入请求队列后,由线程池管理器唤醒线程池中所有处于休眠状态的线程;
请求队列,线程池中处于唤醒状态的所有线程互斥访问请求队列,申请请求队列中的请求,申请到请求的线程依据请求中包含的事件类型访问对应的事件队列,获得非空事件队列中的事件,获得事件的线程调用Esper引擎中的查询处理功能模块进行事件的查询处理,在Esper引擎完成对当前事件的处理后,由线程将当前事件对应的请求返还至请求队列,其中,请求被创建的条件为:线程池管理器接收到事件后,依据当前事件对应的事件类型查询对应的事件队列,仅在被查询的事件队列为空时,创建一个请求并插入请求队列中,该请求包含当前事件的事件类型;
请求被丢弃的条件为:当线程依据申请到的请求中包含的事件类型访问对应的事件队列,而对应的事件队列为空时,当前线程申请到的请求被丢弃。
优选地,所述事件抵达Esper引擎后,由所述线程池管理器对事件进行包装处理。
本发明的有益效果是:本发明解决了多核平台复杂查询中数据流处理的性能问题。本发明能够在不改变原有Esper内部代码与结构的前提下,只通过外加线程管理来管理查询线程,对Esper本身没有“污染”。与现有技术相比,本发明通过外加线程管理以适应多核平台复杂查询,具有事件查询吞吐量高,事件响应时间快等特点,进一步可以推广到其它类Esper引擎数据流查询工具。
附图说明
图1为本发明的线程管理系统的线程管理模块结构图;
图2为本发明中线程池管理器的工作流程图;
图3为本发明中工作线程的工作流程图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明设计的线程管理系统主要是在原查询系统上添加一个线程管理模块,线程管理模块的线程池管理器维护请求队列,合理调度工作线程WorkThread完成事件的查询并输出查询结果。线程管理模块整体框图见图1。
本发明的线程管理模块中核心为线程池管理器ThreadPool,它担负着协调工作线程运行和管理请求队列Reques Queue等工作。线程池管理器主要功能有:初始化线程管理模块中的数据结构;接管Esper引擎发送事件的方法;判断请求队列是否添加新的请求任务。本发明中的线程池管理器的工作流程见图2。
启动Esper数据流引擎工作后,在事件抵达Esper引擎之前需要读取Esper引擎内部参数,如EPL(Event Processing Language)的数目、注册的数据流类型数目等,依据Esper内部参数初始化线程池管理器,其中包括事件队列数目、量化并初始化工作线程等等。
事件抵达Esper引擎后,线程池管理器介入Esper引擎发送事件方法和Esper事件查询过程之间,线程池管理器接管Esper引擎原有事件发送的方法,将事件进行包装处理。线程池管理器依据包装后的事件Wrapped Event查询与当前事件的事件类型相对应的事件队列,如果对应的事件队列非空,表明已有线程为当前事件类型服务,那么不触发请求创建,仅将事件存入对应的事件队列中。当事件对应的队列为空时,线程池管理器创建一个请求,该请求包含当前事件的事件类型并插入请求队列,由线程池管理器唤醒线程池中处于休眠状态的所有工作线程去竞争请求队列中的请求(线程池中的工作线程自线程池管理器初始化之后一直处于休眠状态)。同时,当前事件也被存入事件队列。
处于唤醒状态的所有工作线程互斥地访问请求队列,申请请求,仅有一个工作线程获得请求,其余未获得请求的被唤醒的工作线程继续保持休眠状态等待下一次的唤醒去竞争获得请求。在此竞争中获得请求的工作线程依据请求中包含的事件类型信息去访问对应的事件队列,以获得事件队列中待处理查询的事件。若此时工作线程访问的事件队列为空,则丢弃当前请求,并且将当前工作线程设置为休眠状态,等待下一次被唤醒。成功获得事件的工作线程进行事件调用Esper引擎中的查询处理功能模块进行事件的查询处理,话句话说即转交给Esper引擎进行事件的查询以及结果集的输出。在Esper引擎完成对此事件的处理后,工作线程返还与当前事件对应的请求至请求队列,然后此线程与其它处于唤醒状态的工作线程一样地互斥访问请求队列申请请求,如此循环过程。本发明工作重心是针对线程以及事件进行管理,因此不会更改Esper引擎本身的查询事件过程,以此来保证事件查询结果的正确性以及对Esper的无侵害性。
由此可见,本发明中的线程池管理器的调度策略为:对于同种事件类型的事件工作线程先来先服务查询,并且不会有两个工作线程服务一种类型事件类型查询。不同事件类型之间的工作线程互不影响并发执行查询。
本发明中涉及的数据结构为请求队列、事件队列、工作线程的信号量。
1)请求队列
请求队列是本发明提供的线程管理系统中的一个重要概念。在本发明中,请求不仅是一个任务信号的标识,而且还关联着标识事件流的类型信息,即事件类型。请求队列中每个请求对应一种事件类型,它表示相应类型的事件是否在请求处理,即如果请求队列出现一个请求,则标识某个事件流正需要一个工作线程进行查询处理,工作线程只需要获得此请求即可依据请求包含的事件类型准确地获得待处理的事件。
对队列中请求置位有下列两种情况:(1)工作线程的返还;(2)线程池管理器的添加。如此设计既在访问上保证了线程安全性,又利于工作线程获得事件去查询,更重要的是,此设计避免了Esper引擎原有设计上的缺陷,从而提高了事件的查询效率。
2)事件队列;
本发明在线程管理模块中设计了Java语言的ConcurrentHashMap类型的一个实体,功能是将所有的事件队列存储在此实体中,采用此类型设计保证了并发的工作线程在访问上的互斥性。Map中的元素类型为事件类型(EventType)->事件队列(BlockingQueue)的Key->Value键值对。如此在事件经由线程管理器存储时可以访问Map查询到对应事件类型的队列中,并将之存储。事件队列的类型为BlockingQueue,如此利用了Java阻塞队列的优势。此Map实体的实例化是在线程池管理器启用时进行的初始化阶段依据Esper引擎参数进行的。
3)工作线程的信号量;
在线程管理模块中维持着一个字符串常量EXECUTE_TASK_LOCK,EXECUTE_TASK_LOCK是工作线程被唤醒和休眠依据。工作线程的信号量的设计主要是为了保证EXECUTE_TASK_LOCK的互斥访问。工作线程唤醒以及休眠使用了Java语言中的Object的wait/notify特性。
线程池管理器在初始化阶段中量化并启用工作线程时,初始化每个工作线程,每个工作线程试图访问请求队列获取请求失败则休眠。线程池管理器判断抵达的事件需要添加一个请求到请求队列时,唤醒休眠线程。
本发明所述的线程管理模块,整个管理器的设置是介于Esper引擎事件接收和事件具体查询模块之间,无需修改Esper引擎具体查询过程代码,不破坏Esper引擎内数据结构,因而数据流管理方法在保证查询结果的正确性前提下具有非常好的架构灵活性。

Claims (2)

1.一种支持多核平台下数据流处理的线程管理系统,其特征在于,包括线程池管理器、请求队列、事件队列及包含有多个线程的线程池,其中:
事件队列,用于存入事件,每个事件均具有一个事件类型,不同事件队列对应不同的事件类型,事件抵达Esper引擎后,由线程池管理器接管Esper引擎原有的事件发送方法,将当前事件依据事件类型存入对应的事件队列中;
线程池中的线程的状态在休眠与唤醒之间切换:当线程池管理器初始化后,或当处于唤醒状态的线程无法申请到请求队列中的请求后,或当线程依据申请到的请求中包含的事件类型访问对应的事件队列,而对应的事件队列为空时,线程的状态变更为休眠;
当请求被创建并插入请求队列后,由线程池管理器唤醒线程池中所有处于休眠状态的线程;
请求队列,线程池中处于唤醒状态的所有线程互斥访问请求队列,申请请求队列中的请求,申请到请求的线程依据请求中包含的事件类型访问对应的事件队列,获得非空事件队列中的事件,获得事件的线程调用Esper引擎中的查询处理功能模块进行事件的查询处理,在Esper引擎完成对当前事件的处理后,由线程将当前事件对应的请求返还至请求队列,其中,请求被创建的条件为:线程池管理器接收到事件后,依据当前事件对应的事件类型查询对应的事件队列,仅在被查询的事件队列为空时,创建一个请求并插入请求队列中,该请求包含当前事件的事件类型;
请求被丢弃的条件为:当线程依据申请到的请求中包含的事件类型访问对应的事件队列,而对应的事件队列为空时,当前线程申请到的请求被丢弃。
2.如权利要求1所述的一种支持多核平台下数据流处理的线程管理系统,其特征在于,所述事件抵达Esper引擎后,由所述线程池管理器对事件进行包装处理。
CN201610404750.4A 2016-06-08 2016-06-08 一种支持多核平台下数据流处理的线程管理系统 Expired - Fee Related CN106095535B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610404750.4A CN106095535B (zh) 2016-06-08 2016-06-08 一种支持多核平台下数据流处理的线程管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610404750.4A CN106095535B (zh) 2016-06-08 2016-06-08 一种支持多核平台下数据流处理的线程管理系统

Publications (2)

Publication Number Publication Date
CN106095535A CN106095535A (zh) 2016-11-09
CN106095535B true CN106095535B (zh) 2019-11-08

Family

ID=57227599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610404750.4A Expired - Fee Related CN106095535B (zh) 2016-06-08 2016-06-08 一种支持多核平台下数据流处理的线程管理系统

Country Status (1)

Country Link
CN (1) CN106095535B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108121815B (zh) * 2017-12-28 2022-03-11 深圳开思时代科技有限公司 汽车配件查询方法、装置及系统、电子设备和介质
CN110532067A (zh) * 2018-05-25 2019-12-03 杭州海康威视数字技术股份有限公司 事件处理方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778042A (zh) * 2015-03-30 2015-07-15 江苏省邮电规划设计院有限责任公司 一种基于事件流处理和插件式开发框架的流数据处理方法
CN105141549A (zh) * 2015-08-17 2015-12-09 北京京东尚科信息技术有限公司 网络请求处理方法和装置
CN105573840A (zh) * 2015-12-08 2016-05-11 东软集团股份有限公司 工作流运行期的事件处理方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9098328B2 (en) * 2012-06-26 2015-08-04 Wal-Mart Stores, Inc. Systems and methods for event stream processing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778042A (zh) * 2015-03-30 2015-07-15 江苏省邮电规划设计院有限责任公司 一种基于事件流处理和插件式开发框架的流数据处理方法
CN105141549A (zh) * 2015-08-17 2015-12-09 北京京东尚科信息技术有限公司 网络请求处理方法和装置
CN105573840A (zh) * 2015-12-08 2016-05-11 东软集团股份有限公司 工作流运行期的事件处理方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于组件技术的事件流引擎通信框架的设计与实现;卢山等;《计算机与数字工程》;20111231;第39卷(第264期);第1-5页 *

Also Published As

Publication number Publication date
CN106095535A (zh) 2016-11-09

Similar Documents

Publication Publication Date Title
CN101859260B (zh) 用于操作系统中的定时器管理装置和管理方法
US9329899B2 (en) Parallel execution of parsed query based on a concurrency level corresponding to an average number of available worker threads
US9390130B2 (en) Workload management in a parallel database system
US6976257B2 (en) Context based execution prioritization in Workflow-Management-Systems
CN109656963B (zh) 元数据获取方法、装置、设备及计算机可读存储介质
US20210248469A1 (en) Method and apparatus for scheduling deep learning reasoning engines, device, and medium
CN103942098A (zh) 一种任务处理系统和方法
JP2000339287A (ja) 作業負荷によって管理されるクライアント/サーバ・データ処理システムにおける集中アフィニティ維持装置および方法
CN104202373A (zh) 移动云计算迁移方法及系统
US20140156849A1 (en) Map-reduce workflow processing apparatus and method, and storage media storing the same
CN104408073B (zh) 数据操作方法和装置
CN106095535B (zh) 一种支持多核平台下数据流处理的线程管理系统
Qu et al. An OWL-S based specification model of dynamic entity services for Internet of Things
CN105260244A (zh) 一种分布式系统任务调度的方法和装置
CN114416849A (zh) 数据处理方法、装置、电子设备及存储介质
US8473954B2 (en) Executing operations via asynchronous programming model
EP3782027B1 (en) Independently threading api calls to service a request
CN116932147A (zh) 流式作业处理方法、装置、电子设备及介质
CN116795492A (zh) 云平台的资源调度方法、装置、设备及可读存储介质
CN113722141B (zh) 数据任务的延迟原因确定方法、装置、电子设备及介质
CN104793924B (zh) 计算任务的处理方法及装置
CN112381518A (zh) 事件驱动预警方法、装置、设备及存储介质
Li Design and implementation of distributed asynchronous data aided computer information interaction system
CN113448710B (zh) 基于业务资源的分布式应用系统
CN114490780B (zh) 一种数据流的调度方法、装置、电子设备、介质及产品

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191108