CN112148479B

CN112148479B - 基于Siddhi日志审计中的数据处理方法、装置和计算机设备

Info

Publication number: CN112148479B
Application number: CN202010923533.2A
Authority: CN
Inventors: 常成龙; 范渊; 刘博�
Original assignee: DBAPPSecurity Co Ltd
Current assignee: DBAPPSecurity Co Ltd
Priority date: 2020-09-04
Filing date: 2020-09-04
Publication date: 2024-03-19
Anticipated expiration: 2040-09-04
Also published as: CN112148479A

Abstract

本申请涉及一种基于Siddhi日志审计中的数据处理方法、装置、计算机设备和存储介质。所述方法包括：在Siddhi管理器获取SiddhiQL之后，获取Pattern中第一事件的数据的属性值，其中，属性值包括时间属性或者数据量属性，在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中预设丢弃量的数据，采用本方法能够根据事件数据的属性值在需要时释放内存，从而避免了内存耗尽问题。

Description

基于Siddhi日志审计中的数据处理方法、装置和计算机设备

技术领域

本申请涉及信息安全技术领域，特别是涉及一种基于Siddhi日志审计中的数据处理方法、装置、计算机设备和存储介质。

背景技术

Siddhi是一个轻量级的开源复杂事件流程引擎。它使用类SQL的语言描述事件流任务，可以支撑开发可扩展的、可配置的流式任务执行引擎。传统设计之中，为了支持不同的告警规则类型，需要编写不同的业务逻辑代码，但是使用了Siddhi之后，我们只需要配置不同的流任务SiddhiQL，即可以支持不同的告警业务，检测复杂条件并将输出实时发布到各个端点。Siddhi还用于各种分析和集成平台，例如Apache Eagle作为策略执行引擎。Siddhi在数据源兼容方面可使用来自各种事件源的事件，根据定义的Siddhi应用程序处理事件，并向订阅的事件接收器生成结果。Siddhi可以从内存表或外部数据存储如RDBMS、MongoDB、Hazelcast内存网格中存储和使用事件。Siddhi还允许应用程序和用户通过其存储查询API查询Siddhi，以交互方式从内存和其他存储中检索数据。

Siddhi中的Pattern模式是事件流随时间关联，并根据事件到达的顺序检测事件的模式。然而，在Pattern模式中如在时间窗口内解析的日志源一直是某个事件会引发内存耗尽(Out Of Memory，简称OOM)，影响其它组件处理数据的能力。例如，在时间窗口内有事件A和事件B，原始日志只满足事件A而不满足事件B，此时在时间窗口内会将满足事件A的所有记录全部保存在内存中直到事件B到达或时间窗口失效，因此在时间窗口内，若满足事件A的数据量较大，会造成OOM并进一步导致事件不可控，甚至使程序崩溃。

针对相关技术中，Pattern模式下引发OOM的问题，目前尚未提出有效的解决方案。

发明内容

基于此，有必要针对上述技术问题，提供一种基于Siddhi日志审计中的数据处理方法、装置、计算机设备和存储介质。

第一方面，本申请实施例提供了一种基于Siddhi日志审计中的数据处理方法，包括以下步骤：

在Siddhi管理器获取SiddhiQL之后，获取Pattern中第一事件的数据的属性值，其中，所述属性值包括时间属性或者数据量属性；

在所述属性值大于或者等于预设的属性阈值的情况下，丢弃所述第一事件中预设丢弃量的数据。

在其中一个实施例中，在Siddhi管理器获取SiddhiQL之后，所述方法还包括：

创建队列容器；

根据Pattern中的事件规则获取数据源中的事件数据，放入所述队列容器；

获取所述事件数据的时间戳，根据所述时间戳和Pattern中的输出规则对所述事件数据进行排序，输出排序后的所述事件数据。

在其中一个实施例中，在所述属性值大于或者等于预设的属性阈值的情况下，丢弃所述第一事件中预设丢弃量的数据包括：

在所述第一事件的数据条目数大于或者等于预设的条目阈值的情况下，丢弃所述第一事件中预设丢弃量的数据，其中，所述数据量属性包括所述数据条目数。

在一个实施例中，所述在所述属性值大于或者等于预设的属性阈值的情况下，丢弃所述第一事件中预设丢弃量的数据包括：

在所述第一事件的数据内存量大于或者等于预设的内存阈值的情况下，丢弃所述第一事件中预设丢弃量的数据，其中，所述数据量属性包括所述数据内存量。

在所述第一事件的数据获取时间大于或者等于预设的时间阈值的情况下，丢弃所述第一事件中预设丢弃量的数据，其中，所述时间属性包括所述数据输出时间。

在一个实施例中，所述丢弃所述第一事件中预设丢弃量的数据包括：

获取所述第一事件的数据丢弃范围；

丢弃所述第一事件中预设丢弃量的数据，所述预设丢弃量在所述数据丢弃范围内。

将所述丢弃的数据存储至预设存储空间。

第二方面，本申请实施例还提供一种基于Siddhi日志审计中的数据处理装置，其特征在于，所述装置包括属性模块和丢弃模块：

所述属性模块用于在Siddhi管理器获取SiddhiQL之后，获取Pattern中第一事件的数据的属性值，其中，所述属性值包括时间属性或者数据量属性；

所述丢弃模块用于在所述属性值大于或者等于预设的属性阈值的情况下，丢弃所述第一事件中预设丢弃量的数据。

第三方面，本申请实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述基于Siddhi日志审计中的数据处理方法。

第四方面，本申请实施例还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述基于Siddhi日志审计中的数据处理方法。

上述基于Siddhi日志审计中的数据处理方法、装置、计算机设备和存储介质，在Siddhi管理器获取SiddhiQL之后，获取Pattern中第一事件的数据的属性值，其中，属性值包括时间属性或者数据量属性，在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中预设丢弃量的数据，能够根据事件数据的属性值在需要时释放内存，从而避免了内存耗尽问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本发明实施例的基于Siddhi日志审计中的数据处理方法的服务器的硬件结构图；

图2是根据本发明实施例中基于Siddhi日志审计中的数据处理方法流程图；

图3是根据本发明实施例中基于Siddhi日志审计中的数据处理方法中无序数据处理的流程图；

图4是根据本发明优选实施例中基于Siddhi日志审计中的数据处理方法的流程图；

图5是根据本发明优选实施例的基于Siddhi日志审计中的数据处理方法中无序数据处理流程图；

图6是根据本发明实施例中基于Siddhi日志审计中的数据处理装置的示意图；

图7是根据本发明实施例中基于Siddhi日志审计中的数据处理计算机设备的示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行描述和说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。基于本申请提供的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

显而易见地，下面描述中的附图仅仅是本申请的一些示例或实施例，对于本领域的普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图将本申请应用于其他类似情景。此外，还可以理解的是，虽然这种开发过程中所作出的努力可能是复杂并且冗长的，然而对于与本申请公开的内容相关的本领域的普通技术人员而言，在本申请揭露的技术内容的基础上进行的一些设计，制造或者生产等变更只是常规的技术手段，不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是，本申请所描述的实施例在不冲突的情况下，可以与其它实施例相结合。

除非另作定义，本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制，可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形，意图在于覆盖不排他的包含；例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可以还包括没有列出的步骤或单元，或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电气的连接，不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：单独存在A，同时存在 A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或” 的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象，不代表针对对象的特定排序。

本实施例提供的方法实施例可以在终端、计算机、服务器或者类似的运算装置中执行。以运行在终端上为例，图1是本发明实施例的基于Siddhi日志审计中的数据处理方法的服务器的硬件结构图。如图1所示，服务器10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于中央处理器CPU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104，可选地，上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述终端的结构造成限定。例如，服务器10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。在服务器10上部署的Siddhi管理器获取SiddhiQL之后，获取Pattern中第一事件的数据的属性值，其中，属性值包括时间属性或者数据量属性；在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中预设丢弃量的数据。其中，服务器10可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的基于Siddhi日志审计中的数据处理方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102 远程设置的存储器，这些远程存储器可以通过网络连接至服务器10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器10的通信供应商提供的无线网络。在一个实例中，传输设备106 包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯，搜集网络日志信息。在一个实例中，传输设备106可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

在一个实施例中，图2是根据本发明实施例中基于Siddhi日志审计中的数据处理方法流程图，如图2所示，提供了一种基于Siddhi日志审计中的数据处理方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

步骤S210，在Siddhi管理器获取SiddhiQL之后，获取Pattern中第一事件的数据的属性值。输入pattern模式的结构化SiddhiQL语法，将输入的SiddhiQL 加载到SiddhiManager管理器中，并对SiddhiQL进行解析，在SiddhiManager 对SiddhiQL进行解析的过程中，首先使用antlr4语法判断SiddhiQL是否异常， antlr4语法用作读取、处理、执行或翻译结构化文本或二进制文件，用来构建新的语言、工具和框架；再将SiddhiQL转化为Siddhi可管理的代码，对SiddhiQL 进行解析。在解析过程中获取pattern中的单个事件的数据的数据属性，以便于后续进行数据管理策略，上述属性值包括时间属性或者数据量属性；

步骤S220，在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中预设丢弃量的数据。由于OOM的本质问题即内存中的数据存储量过大，因此为了解决OMM问题，以pattern中单个时间的数据的属性为依据，当该属性值大于或者等于预设属性阈值的情况下，对该事件的数据进行丢弃处理。然后接入数据源进入stream中进行验证、匹配，满足Pattern模式中事件条件的数据源将放入对应的pattern事件流中处理，Pattern中的事件会按照对应的策略去处理事件流，最终在时间窗口内满足pattern的数据将进行输出。

通过步骤S210至步骤S220，在Siddhi管理器获取SiddhiQL之后，获取 Pattern中第一事件的数据的属性值，在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中预设丢弃量的数据，可以实现根据数据属性值释放出部分内存，从而避免了OOM问题。

在一个实施例中，在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中预设丢弃量的数据包括以下步骤：在数据量属性包括数据条目数的情况下，在第一事件的数据条目数大于或者等于预设的条目阈值的情况下，丢弃第一事件中预设丢弃量的数据。在本实施例中，数据管理策略是根据数据条目数量进行的，在解析过程中获取pattern中的单个事件，即上述第一事件数据的数据条目数，当条目数到达预设的阈值限制时丢弃第一事件的部分数据，上述预设丢弃量可以根据数据条目的平均大小以及内存的大小进行设定。本实施例提供了一种简洁高效的数据管理方式，在数据条目数较大的情况系下可释放出部分内存，从而避免了OOM问题。

在一个实施例中，在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中预设丢弃量的数据包括以下步骤：在数据量属性包括数据内存量的情况下，在第一事件的数据内存量大于或者等于预设的内存阈值的情况下，丢弃第一事件中预设丢弃量的数据。在本实施例中，数据管理策略是根据第一事件的数据所占用的内存大小进行的，在解析过程中获取pattern中的单个事件，即上述第一事件数据的数据内存量，当数据的内存量到达预设的阈值限制时丢弃第一事件的部分数据，上述预设丢弃量可以根据数据当前所占用的内存大小以及可用内存的大小进行设定。本实施例提供了一种直观、高效的数据管理方式，在数据内存量较大的情况系下可释放出部分内存，从而避免了OOM问题。

在一个实施例中，在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中预设丢弃量的数据包括以下步骤：在时间属性包括数据输出时间的情况下，在第一事件的数据获取时间大于或者等于预设的时间阈值的情况下，丢弃第一事件中预设丢弃量的数据。在本实施例中，数据管理策略是根据第一事件的数据获取时间进行的，在解析过程中获取pattern中的单个事件，即上述第一事件的数据，当数据的获取时间超出预设的时间阈值时丢弃第一事件的部分数据，上述预设丢弃量可以根据可用内存的大小进行设定。本实施例提供了一种高效的数据管理方式，在数据获取时间超出时间阈值的情况系下可释放出部分内存，从而避免了OOM问题。

在一个实施例中，丢弃第一事件中预设丢弃量的数据包括以下步骤：获取第一事件的数据丢弃范围；丢弃第一事件中预设丢弃量的数据，预设丢弃量在数据丢弃范围内。例如，采取1-n的丢弃规则，即在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中1条至n条数据，n的取值可以根据应用场景在SiddhiQL中进行预定义，而丢弃的过程中的丢弃数量是可以在1至n中变化的。可选地，可以根据数据的重要性来决定可将丢弃的数据量，例如，用户对数据的要求不高，数据的重要性较低的情况下，可以丢弃全部数据。在本实施例中，提供了一种更加灵活的数据丢弃方案，使得基于Siddhi日志审计中的数据处理方法能够有更好的适应性，满足更多的应用场景。

在一个实施例中，丢弃第一事件中预设丢弃量的数据包括以下步骤：将丢弃的数据存储至预设存储空间。在本实施例中，提供了一种丢弃的数据的处理方式，将并丢弃数据存储可追踪溯源的预设存储空间中，在不影响Siddhi日志审计的情况下，还能在后续需要进行数据分析或者追溯的情况下，从预设存储空间中获取到被丢弃的数据，使得基于Siddhi日志审计中的数据处理方法的数据处理可靠性更高，灵活性更高。

在大数据实时分析级关联规则及网站攻击追踪溯源中都可以引用Pattern模式，pattern模式根据内部创建状态机来跟踪匹配过程的状态，可以使多个输入流或同一输入流上的事件相关联，Pattern模式只能按照事件的先后顺序去匹配。当网络延迟的时候事件的log到达事件流Event Stream的顺序会是一种无序的现象而Pattern是一种有序的现象，所以日志乱序后会出现无法判断状态的情况。例如，在网站受到大量攻击此时，对攻击的数据源进行解析并使用Pattern模式做分析，pattern模式中定义的事件顺序为先A后B，但因为网络问题，pattern 中的stream流接收解析日志log.A和log.B的顺序为先log.B后log.A，那么在时间窗口内Siddhi无法判断网站受到大量攻击也无法触发告警。因此，在获取 Pattern事件中的数据的过程中，Pattern多事件在时间窗口内不按顺序匹配会出现失效，导致数据丢失造成有效数据的不可控。

在一个实施例中，图3是根据本发明实施例中基于Siddhi日志审计中的数据处理方法中无序数据处理的流程图，如图3所示，在Siddhi管理器获取 SiddhiQL之后，包括以下步骤：

步骤S310，创建队列容器。该队列容器可以被用作缓存无序的数据。

步骤S320，根据Pattern中的事件规则获取数据源中的事件数据，放入队列容器。接入数据源进入stream中验证、匹配满足的数据源，并由stream分配到对应的pattern中，并对多事件进行一一匹配当满足事件时放入队列容器中。例如，在Pattern中包括事件A和事件B，steam将对数据源中的数据与事件A、事件B进行匹配，无论是与事件A匹配或者是与事件B匹配的数据都将放入队列容器中做缓存。

步骤S330，获取事件数据的时间戳，根据时间戳和Pattern中的输出规则对事件数据进行排序，输出排序后的事件数据。获取队列容器中各个事件数据的时间戳，重新按照时间戳排列数据，再根据Pattern中规定的输出规则对事件数据进行排序。pattern模式将按照队列中的时间顺序对数据进行排序处理并按照 pattern模式进行，最终将时间窗口内满足pattern规则的将对数据进行输出。

通过步骤S310至步骤S330，通过队列容器的设置，可以将无序排列的、但是符合Pattern中的事件的数据进行缓存，再按照事件的时间戳重新排列，再输出实际符合Pattern模式的数据。在一些实施例中，步骤S320中，stream验证、匹配过程中，仅包括时间戳的数据会被存储。通过本实施方式能够更加准确地获取到满足pattern规则的数据，提高Siddhi日志审计中的数据处理的准确性。上述pattern数据的丢弃策略也可以用于队列容器中的数据存储过程。

下面通过优选实施例对本申请实施例进行描述和说明。在一个优选实施例中，图4是根据本发明优选实施例中基于Siddhi日志审计中的数据处理方法的流程图，如图4所示，该方法包括以下步骤：

步骤S410，输入pattern模式的SiddhiQL语法。其中，语法中包括数据管理策略的规则设置，即对于数据属性值以及属性阈值的设置。例如 within:strategy<20,10min,1,10>)指示10分钟内只允许20条数据记录存入内存，当达数据记录到20条记录时可丢弃1-10条数据；within:strategy<10M,1,10>)指示当存储的数据到达10M时会丢弃1-10条数据；within:strategy<100,1,10>)指示当存储的数据量到达100时，会选择1-10条数据进行丢弃。

步骤S420，加载管理器SiddhiManager。

步骤S430，解析SiddhiQL。将解析的sql加载到管理器中进行管理。

步骤S440，接入数据源。

步骤S450，Pattern处理。根据Pattern模式中stream的定义接入源数据流并验证数据是否满足stream中的条件。

步骤S460，执行数据管理策略。当存储的数据达到策略限定的阈值时会根据策略进行数据的筛选、控制和丢弃。例如，步骤S462，根据数据数量限制策略进行数据控制，具体地，步骤S463通过1至n丢弃规则，即在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中1条至n条数据，n的取值可以根据应用场景在SiddhiQL中进行预定义，而丢弃的过程中的丢弃数量是可以在1至n中变化的；步骤S464是过期时间策略，具体地，通过步骤S465，当数据的获取时间超出预设的时间阈值时丢弃第一事件的部分数据；步骤S466是根据内存大小限制策略，具体地，通过步骤S467，当数据的内存量到达预设的阈值限制时丢弃第一事件的部分数据，上述预设丢弃量可以根据数据当前所占用的内存大小以及可用内存的大小进行设定。

步骤S470，输出结果。将符合事件条件和数据策略的数据进行输出到outLog 中。

上述基于Siddhi日志审计中的数据处理方法还包括无序数据的处理过程，图5是根据本发明优选实施例的基于Siddhi日志审计中的数据处理方法中无序数据处理流程图，如图5所示，无序数据处理包括以下步骤：

步骤S510，输入pattern模式的SiddhiQL语法。

步骤S520，加载管理器SiddhiManager。

步骤S530，解析SiddhiQL。将解析的sql加载到管理器中进行管理。

步骤S540，Pattern模式创建队列容器。

步骤S550，Pattern进行处理，根据stream log定义以及数据的时间戳 timestamp将符合事件规则的事件数据存入队列容器。

步骤S560，队列容器排序。在时间窗口within 10min内进行事件数据的排序处理。

步骤S570，输出结果。将符合的数据进行输出到outLog中。

上述优选实施例可以克服Siddhi中Pattern模式在多事件流中无法按乱序匹配以及多事件中的OOM问题，可以使得基于Siddhi的日志审计高效、顺利地进行。

应该理解的是，虽然图2至图5的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2至图5中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，图6是根据本发明实施例中基于Siddhi日志审计中的数据处理装置的示意图，如图6所示，提供了一种基于Siddhi日志审计中的数据处理装置60，该装置包括属性模块62和丢弃模块64。

属性模块62用于在Siddhi管理器获取SiddhiQL之后，获取Pattern中第一事件的数据的属性值，其中，属性值包括时间属性或者数据量属性。

丢弃模块64用于在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中预设丢弃量的数据。

关于基于Siddhi日志审计中的数据处理装置的具体限定可以参见上文中对于基于Siddhi日志审计中的数据处理方法的限定，在此不再赘述。上述基于 Siddhi日志审计中的数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，图7是根据本发明实施例中基于Siddhi日志审计中的数据处理计算机设备的示意图，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于Siddhi日志审计中的数据处理数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于Siddhi日志审计中的数据处理方法。

本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述基于Siddhi日志审计中的数据处理方法。

上述基于Siddhi日志审计中的数据处理计算机设备，在Siddhi管理器获取SiddhiQL之后，获取Pattern中第一事件的数据的属性值，其中，属性值包括时间属性或者数据量属性，在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中预设丢弃量的数据，能够根据事件数据的属性值在需要时释放内存，从而避免了内存耗尽问题。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述基于Siddhi日志审计中的数据处理方法。

上述基于Siddhi日志审计中的数据处理存储介质，在Siddhi管理器获取SiddhiQL之后，获取Pattern中第一事件的数据的属性值，其中，属性值包括时间属性或者数据量属性，在属性值大于或者等于预设的属性阈值的情况下，丢弃第一事件中预设丢弃量的数据，能够根据事件数据的属性值在需要时释放内存，从而避免了内存耗尽问题。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程 ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限， RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步 DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM (ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus) 直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于Siddhi日志审计中的数据处理方法，其特征在于，所述方法包括：

在Siddhi管理器获取SiddhiQL之后，创建队列容器；根据Pattern中的事件规则获取数据源中的事件数据，放入所述队列容器；获取所述事件数据的时间戳，根据所述时间戳和Pattern中的输出规则对所述事件数据进行排序，输出排序后的所述事件数据；

获取Pattern中第一事件的数据的属性值，其中，所述属性值包括时间属性或者数据量属性；

2.根据权利要求1所述的方法，其特征在于，所述在所述属性值大于或者等于预设的属性阈值的情况下，丢弃所述第一事件中预设丢弃量的数据包括：

3.根据权利要求1所述的方法，其特征在于，所述在所述属性值大于或者等于预设的属性阈值的情况下，丢弃所述第一事件中预设丢弃量的数据包括：

4.根据权利要求1所述的方法，其特征在于，所述在所述属性值大于或者等于预设的属性阈值的情况下，丢弃所述第一事件中预设丢弃量的数据包括：

5.根据权利要求1至4任一项所述的方法，其特征在于，所述丢弃所述第一事件中预设丢弃量的数据包括：

获取所述第一事件的数据丢弃范围；

6.根据权利要求1所述的方法，其特征在于，所述丢弃所述第一事件中预设丢弃量的数据包括：

将所述丢弃的数据存储至预设存储空间。

7.一种基于Siddhi日志审计中的数据处理装置，其特征在于，所述装置包括属性模块和丢弃模块：

所述属性模块用于在Siddhi管理器获取SiddhiQL之后，创建队列容器；根据Pattern中的事件规则获取数据源中的事件数据，放入所述队列容器；获取所述事件数据的时间戳，根据所述时间戳和Pattern中的输出规则对所述事件数据进行排序，输出排序后的所述事件数据；

所述属性模块还用于获取Pattern中第一事件的数据的属性值，其中，所述属性值包括时间属性或者数据量属性；

8.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。