CN111158691A - 实现规则引擎动态化的方法 - Google Patents

实现规则引擎动态化的方法 Download PDF

Info

Publication number
CN111158691A
CN111158691A CN201911231444.5A CN201911231444A CN111158691A CN 111158691 A CN111158691 A CN 111158691A CN 201911231444 A CN201911231444 A CN 201911231444A CN 111158691 A CN111158691 A CN 111158691A
Authority
CN
China
Prior art keywords
rule
matrix
sub
rules
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911231444.5A
Other languages
English (en)
Other versions
CN111158691B (zh
Inventor
储天
范渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DBAPPSecurity Co Ltd
Original Assignee
DBAPPSecurity Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DBAPPSecurity Co Ltd filed Critical DBAPPSecurity Co Ltd
Priority to CN201911231444.5A priority Critical patent/CN111158691B/zh
Publication of CN111158691A publication Critical patent/CN111158691A/zh
Application granted granted Critical
Publication of CN111158691B publication Critical patent/CN111158691B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • G06F8/427Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种实现规则引擎动态化的方法,包括以下步骤:1)、使用语法解析技术解析规则,规则解析成语法树;2)、从语法树中提取最简模式,得到最简模式矩阵;3)、对最简模式矩阵构建网状结构。本发明是从规则中提取出模式,将模式组合成网状结构,以提高对数据的消费速度,降低资源的重复浪费。网状结构可以保证同一条数据,每个模式只经过一次计算。规则提取技术则保证了,原始规则和处理后的规则有同样的语义,保证了执行结果的正确性。

Description

实现规则引擎动态化的方法
技术领域
本发明涉及一种规则动态化方法,具体涉及一种实现规则引擎动态化的方法。
背景技术
Aviator是一个高性能、轻量级的java语言实现的表达式求值引擎,主要用于各种表达式的动态求值。现在已经有很多开源可用的java表达式求值引擎,为什么还需要Avaitor呢?
Aviator的设计目标是轻量级和高性能,相比于Groovy、JRuby的笨重,Aviator非常小,加上依赖包也才537K,不算依赖包的话只有70K;当然,Aviator的语法是受限的,它不是一门完整的语言,而只是语言的一小部分集合。
其次,Aviator的实现思路与其他轻量级的求值器很不相同,其他求值器一般都是通过解释的方式运行,而Aviator则是直接将表达式编译成JVM字节码,交给JVM去执行。简单来说,Aviator的定位是介于Groovy这样的重量级脚本语言和IKExpression这样的轻量级表达式引擎之间。
Aviator的特性:
1、支持绝大多数运算操作符,包括算术操作符、关系运算符、逻辑操作符、位运算符、正则匹配操作符(=~)、三元表达式(?:)
2、支持操作符优先级和括号强制设定优先级
3、逻辑运算符支持短路运算。
4、支持丰富类型,例如nil、整数和浮点数、字符串、正则表达式、日期、变量等,支持自动类型转换。
5、内置一套强大的常用函数库
6、可自定义函数,易于扩展
7、可重载操作符
8、支持大数运算(BigInteger)和高精度运算(BigDecimal)
9、性能优秀
在计算机科学中,抽象语法树(AbstractSyntaxTree,AST),或简称语法树(Syntaxtree),是源代码语法结构的一种抽象表示。它以树状的形式表现编程语言的语法结构,树上的每个节点都表示源代码中的一种结构。之所以说语法是“抽象”的,是因为这里的语法并不会表示出真实语法中出现的每个细节。比如,嵌套括号被隐含在树的结构中,并没有以节点的形式呈现;而类似于if-condition-then这样的条件跳转语句,可以使用带有两个分支的节点来表示。
在计算机科学和语言学中,语法分析(英语:syntactic analysis,也叫parsing)是根据某种给定的形式;
文法对由单词序列(如英语单词序列)构成的输入文本进行分析并确定其语法结构的一种过程。
语法分析器(parser)通常是作为编译器或解释器的组件出现的,它的作用是进行语法检查、并构建由输入的单词组成的数据结构(一般是语法分析树、抽象语法树等层次化的数据结构)。语法分析器通常使用一个独立的词法分析器从输入字符流中分离出一个个的“单词”,并将单词流作为其输入。实际开发中,语法分析器可以手工编写,也可以使用工具(半)自动生成。
语法分析器的任务主要是确定是否可以以及如何从语法的起始符号推导出输入符号串(输入文本),主要可以通过两种方式完成:
自顶向下分析:根据形式语法规则,在语法分析树的自顶向下展开中搜索输入符号串可能的最左推导。单词按从左到右的顺序依次使用。
自底向上分析:语法分析器从现有的输入符号串开始,尝试将其根据给定的形式语法规则进行改写,最终改写为语法的起始符号。
现有的方法是对所有的规则进行遍历,由于这些规则是针对同一批数据,在规则数量越大的情况下,相似的条件会有很多,即相同的模式会出现多次,在这种情况下,会产生针对同一规则的多次计算。造成较大的资源浪费和时间消耗。
因此,需要对现有技术进行改进。
发明内容
本发明要解决的技术问题是提供一种高效的实现规则引擎动态化的方法。
为解决上述技术问题,本发明提供一种实现规则引擎动态化的方法,包括以下步骤:
1)、使用语法解析技术解析规则,规则解析成语法树;
2)、从语法树中提取最简模式,得到最简模式矩阵;
3)、对最简模式矩阵构建网状结构。
作为对本发明实现规则引擎动态化的方法的改进:
步骤2为使用矩阵方法来对表达式化简。
作为对本发明实现规则引擎动态化的方法的进一步改进:
步骤2包括:
2.1)、如果当前语法节点是叶子节点,生成当前节点的一阶析范矩阵,
2.2)、如果当前不是叶子节点;
2.3)、获取第一个子节点和第二个子节点;
2.4)、根据与,或规则进行计算;
2.5)、使用吸收,化简矩阵;
2.6)、根节点的矩阵就是化简结果。
作为对本发明实现规则引擎动态化的方法的进一步改进:
步骤3为:将步骤2得到的最简模式矩阵中的子规则共用相同的子表达式,将多个管道混合在一起,共用管道的节点,这样组成一个网络结构来描述优化后的所有规则。
作为对本发明实现规则引擎动态化的方法的进一步改进:
还包括步骤4:为数据加上规则标志。
作为对本发明实现规则引擎动态化的方法的进一步改进:
步骤2中对于子表达式,建立一个全局缓存空间存储,同时会对子表达式做全局唯一性检查;
对于矩阵的顺序做调整,调整规则可以是子表达式的名称顺序,复杂度顺序或是其他可扩展的排序方法。
本发明实现规则引擎动态化的方法的技术优势为:
本发明是从规则中提取出模式,将模式组合成网状结构,以提高对数据的消费速度,降低资源的重复浪费。网状结构可以保证同一条数据,每个模式只经过一次计算。规则提取技术则保证了,原始规则和处理后的规则有同样的语义,保证了执行结果的正确性。
本发明方法优势在于:
1、提高了计算资源的利用效率;
2、提高了引擎的处理性能。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细说明。
图1为语法解析技术解析规则的示意图;
图2为对模式构建网状结构示意图。
具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此。
实施例1、实现规则引擎动态化的方法,如图1-2所示,包括以下步骤:
A)、使用语法解析技术解析规则:
这一步将规则解析成语法树。这里的规则是由aviator语言描述的,规则在语言中表现为布尔表达式。所以根据布尔表达式的特征,可以将规则细分为几种小规则:
1、表示与的规则:这种规则有两个子规则,当子规则都为真时,该规则是真。若两个规则任一个是假或都是假,那么该规则为假。
2、表示或的规则:这种规则有两个子规则,当子规则都为假时,该规则是假。若两个规则任一个是真或都是真,那么该规则为真。
3、表示非的规则:这种规则有一个子规则,当子规则为真时,该规则是真。当子规则是假时,该规则是假。
4、原子规则:上面3种规则之外的规则,视为不可分规则。
根据上面的划分方法,可以对于每条规则都构建一颗语法树,树枝是与或非三种规则,叶子节点是原子规则。
例如解析成的语法树如图1所示:((((X0&X1)&!(X2))|(X3&X0))|X3);
B)、从规则中提取最简模式。
构建完成语法树后,需要从语法树中提取最简模式的规则,便于后续的进一步处理。
最简模式是对布尔表达式的化简,这里使用矩阵方法来对表达式化简。
设表达式出现的所有布尔变量为xi(i=1,2…n),n为布尔变量的个数,m为表达式的最小项个数。
例如x1 x3 x5+x2 x4+x1 x2 x4 x5可以写成:
1 0 1 0 1
0 1 0 1 0
1 1 0 1 1
单个布尔变量可以看成一个特殊的析取范式,只有一个最小项,且最小项只有一个布尔变量。
将步骤A中的语法树化简后得到(X0&X1&(!X2))|X3。
下面说下关于矩阵的运算规则:
1、析范矩阵的或运算:
表达式A与表达式B的或运算,只需要将A和B的矩阵各行合并在一起,就可以得到结果
Figure BDA0002303658510000051
其中n为A和B使用的布尔变量个数,m为A中最小项个数,g为B中最小项个数。
2、单行析范矩阵的与操作
对于两个单行析范矩阵,他们的与操作也是一个单行析范矩阵,该矩阵的元素分别是两个矩阵对应元素的计算结果:
[a1 a2...an]*[b1 b2...bn]=[a1b1 a2b2...anbn]
3、析范矩阵的与操作
布尔表达式A与布尔表达式B进行与操作,只要将A与B的矩阵的各行两两进行单行析范矩阵的与操作。
Figure BDA0002303658510000052
4、析范矩阵的吸收操作:
在矩阵中,如果某行含有另一行的所有非0元素,那么这行要被删除。
例如:
Figure BDA0002303658510000053
5、如何从语法树生成析范矩阵;
5.1)、如果当前语法节点是叶子节点(atom或者notatom),生成当前节点的一阶析范矩阵,
5.2)、如果当前不是叶子节点;
5.3)、获取第一个子节点和第二个子节点;
5.4)、根据与,或规则进行计算;
5.5)、使用吸收操作,化简矩阵;
5.6)、根节点的矩阵就是化简结果。
6、上述的是现有布尔化简的算法简述,在规则引擎中还需要处理一些具体的工程优化,得到优化处理后的最简模式矩阵:
6.1)、对于子表达式,建立一个全局缓存空间存储,在步骤C中使用,同时会对子表达式做全局唯一性检查。若唯一性检查不成立,会抛出异常。
6.2)、对于矩阵的顺序做调整,调整规则可以是子表达式的名称顺序,复杂度顺序或是其他可扩展的排序方法。
C)、对模式构建网状结构。
在获得上一步骤,所述的优化处理后的最简模式矩阵后,该矩阵任意一行都表示了当前规则的一个子规则,并且这个子规则是可以表示成多个模式的管道。
涵义为x1 x3 x5+x2 x4+x1 x2 x4 x5的最简矩阵如下:
1 0 1 0 1 该行表示一个子规则x1 x3 x5
0 1 0 1 0
对于子规则x1 x3 x5,实质上的涵义是数据经过模式x1,再经过模式x3,经过模式x5。将多个管道混合在一起,共用管道的节点,这样,可以组成一个网络结构来描述优化后的所有规则。
步骤1:将各个子规则中的子表达式(x1,x3,x5)作为节点,然后使用带方向的管道将节点依次连接,这就代表了一个子规则x1 x3 x5
步骤2:对所有规则的子规则进行上述步骤1操作,可以得到一个网络结构,这个结构就是所有规则的优化结果。
假设有另一个化简后表达式是(X0&X1&(!X3)),可以和(X0&X1&(!X2))|X3共用子表达式X0&X1。如图2所示;对于x0 x1!x2和x0 x1!x3,可以将多个管道混合在一起,共用管道的节点,先计算数据是否匹配x0,x1,再分别计算是否匹配!x2和!x3,也就是对于数据和x0x1仅计算了一次。这样就提高了计算效率。
D)、为数据加上规则标志。
在上一步中通过管道构建了规则网络,需要在每个管道的结束节点中添加对规则的处理,为数据加上标志(以区分数据符合的规则)或是进一步加工。
术语:
rules:规则,由一到多个条件构成。一般用and或or连接conditions。
conditions:条件,规则的组成部分,指对象之间及对象属性之间的关系。
module:模式,模式就是指不能继续分割下去的最小的原子条件。
最后,还需要注意的是,以上列举的仅是本发明的若干个具体实施例。显然,本发明不限于以上实施例,还可以有许多变形。本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变形,均应认为是本发明的保护范围。

Claims (6)

1.实现规则引擎动态化的方法,其特征在于:包括以下步骤:
1)、使用语法解析技术解析规则,规则解析成语法树;
2)、从语法树中提取最简模式,得到最简模式矩阵;
3)、对最简模式矩阵构建网状结构。
2.根据权利要求1所述的实现规则引擎动态化的方法,其特征在于:
步骤2为使用矩阵方法来对表达式化简。
3.根据权利要求2所述的实现规则引擎动态化的方法,其特征在于:
步骤2包括:
2.1)、如果当前语法节点是叶子节点,生成当前节点的一阶析范矩阵,
2.2)、如果当前不是叶子节点;
2.3)、获取第一个子节点和第二个子节点;
2.4)、根据与,或规则进行计算;
2.5)、使用吸收,化简矩阵;
2.6)、根节点的矩阵就是化简结果。
4.根据权利要求3所述的实现规则引擎动态化的方法,其特征在于:
步骤3为:将步骤2得到的最简模式矩阵中的子规则共用相同的子表达式,将多个管道混合在一起,共用管道的节点,这样组成一个网络结构来描述优化后的所有规则。
5.根据权利要求4所述的实现规则引擎动态化的方法,其特征在于:
还包括步骤4:为数据加上规则标志。
6.根据权利要求5所述的实现规则引擎动态化的方法,其特征在于:
步骤2中对于子表达式,建立一个全局缓存空间存储,同时会对子表达式做全局唯一性检查;
对于矩阵的顺序做调整,调整规则可以是子表达式的名称顺序,复杂度顺序或是其他可扩展的排序方法。
CN201911231444.5A 2019-12-05 2019-12-05 实现规则引擎动态化的方法 Active CN111158691B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911231444.5A CN111158691B (zh) 2019-12-05 2019-12-05 实现规则引擎动态化的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911231444.5A CN111158691B (zh) 2019-12-05 2019-12-05 实现规则引擎动态化的方法

Publications (2)

Publication Number Publication Date
CN111158691A true CN111158691A (zh) 2020-05-15
CN111158691B CN111158691B (zh) 2023-10-13

Family

ID=70556478

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911231444.5A Active CN111158691B (zh) 2019-12-05 2019-12-05 实现规则引擎动态化的方法

Country Status (1)

Country Link
CN (1) CN111158691B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5584027A (en) * 1994-08-31 1996-12-10 Motorola Inc. Method and apparatus for finding induction variables for use in compiling computer instructions
US20030036898A1 (en) * 1999-10-18 2003-02-20 Lei Duan Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
US20060062471A1 (en) * 2004-09-22 2006-03-23 Microsoft Corporation Analyzing subordinate sub-expressions in expression recognition
US20090326924A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Projecting Semantic Information from a Language Independent Syntactic Model
CN102165518A (zh) * 2008-08-27 2011-08-24 罗伯特·博世有限公司 用于在对话系统中从用户话语产生自然语言短语的系统和方法
US20140282444A1 (en) * 2013-03-15 2014-09-18 ArtinSoft Corporation Programming language transformations with abstract syntax tree extensions
CN105404611A (zh) * 2015-11-09 2016-03-16 南京大学 一种基于矩阵模型的多计算引擎的自动选择方法
CN106682343A (zh) * 2016-08-31 2017-05-17 电子科技大学 一种基于图的邻接矩阵的形式化验证方法
WO2017107154A1 (zh) * 2015-12-24 2017-06-29 华为技术有限公司 一种矩阵运算的源到源转换方法及源到源编译器
US20180373986A1 (en) * 2017-06-26 2018-12-27 QbitLogic, Inc. Machine learning using dynamic multilayer perceptrons
CN109376248A (zh) * 2018-09-04 2019-02-22 梁怀新 一种基于增量学习的知识库构建及偏序结构图生成方法
CN109726185A (zh) * 2018-12-28 2019-05-07 杭州安恒信息技术股份有限公司 一种基于语法树的日志解析方法、系统和计算机可读介质
CN109960506A (zh) * 2018-12-03 2019-07-02 复旦大学 一种基于结构感知的代码注释生成方法
CN110018829A (zh) * 2019-04-01 2019-07-16 北京东方国信科技股份有限公司 提高pl/sql语言解释器执行效率的方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5584027A (en) * 1994-08-31 1996-12-10 Motorola Inc. Method and apparatus for finding induction variables for use in compiling computer instructions
US20030036898A1 (en) * 1999-10-18 2003-02-20 Lei Duan Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
US20060062471A1 (en) * 2004-09-22 2006-03-23 Microsoft Corporation Analyzing subordinate sub-expressions in expression recognition
US20090326924A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Projecting Semantic Information from a Language Independent Syntactic Model
CN102165518A (zh) * 2008-08-27 2011-08-24 罗伯特·博世有限公司 用于在对话系统中从用户话语产生自然语言短语的系统和方法
US20140282444A1 (en) * 2013-03-15 2014-09-18 ArtinSoft Corporation Programming language transformations with abstract syntax tree extensions
CN105404611A (zh) * 2015-11-09 2016-03-16 南京大学 一种基于矩阵模型的多计算引擎的自动选择方法
WO2017107154A1 (zh) * 2015-12-24 2017-06-29 华为技术有限公司 一种矩阵运算的源到源转换方法及源到源编译器
CN106682343A (zh) * 2016-08-31 2017-05-17 电子科技大学 一种基于图的邻接矩阵的形式化验证方法
US20180373986A1 (en) * 2017-06-26 2018-12-27 QbitLogic, Inc. Machine learning using dynamic multilayer perceptrons
CN109376248A (zh) * 2018-09-04 2019-02-22 梁怀新 一种基于增量学习的知识库构建及偏序结构图生成方法
CN109960506A (zh) * 2018-12-03 2019-07-02 复旦大学 一种基于结构感知的代码注释生成方法
CN109726185A (zh) * 2018-12-28 2019-05-07 杭州安恒信息技术股份有限公司 一种基于语法树的日志解析方法、系统和计算机可读介质
CN110018829A (zh) * 2019-04-01 2019-07-16 北京东方国信科技股份有限公司 提高pl/sql语言解释器执行效率的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张真;李宁;田英爱;耿思;许洁;: "语法分析与纠错相结合的文档结构重构方法", 北京信息科技大学学报(自然科学版), no. 02 *
石峰, 刘坚: "一种解析GCC抽象语法树的方法", 计算机应用, no. 03 *

Also Published As

Publication number Publication date
CN111158691B (zh) 2023-10-13

Similar Documents

Publication Publication Date Title
US11036614B1 (en) Data control-oriented smart contract static analysis method and system
CN110187885B (zh) 一种量子程序编译的中间代码生成方法及装置
Van den Brand et al. Disambiguation filters for scannerless generalized LR parsers
Hutton et al. Monadic parsing in Haskell
CN111309757B (zh) 一种HBase的SQL解释器和优化方法
US20090144229A1 (en) Static query optimization for linq
US9311058B2 (en) Jabba language
EP1746517A2 (en) XPath automaton systems and methods
CN113741869B (zh) 一种高性能的可变语法编程语言的构造方法
Holzmann Cobra: a light-weight tool for static and dynamic program analysis
CN109857458B (zh) 基于ANTLR的AltaRica 3.0的扁平化的转化方法
WO2005111824A2 (en) Method and system for processing of text content
US20080141230A1 (en) Scope-Constrained Specification Of Features In A Programming Language
Maneth et al. XPath whole query optimization
CN111158691B (zh) 实现规则引擎动态化的方法
Borsotti et al. General parsing with regular expression matching
Jain et al. Compiler Basic Design And Construction
Handzhiyski et al. Tunnel parsing with counted repetitions
Handzhiyski et al. A parsing machine architecture encapsulating different parsing approaches
Grigorev et al. String-embedded language support in integrated development environment
KR101225333B1 (ko) 구문론적으로 분석된 텍스트 코퍼스로부터 정보를 추출하는 트리 패턴 표현식을 이용한 시스템 및 방법
Manna et al. On the complexity of regular-grammars with integer attributes
Megacz Scannerless boolean parsing
Kollár et al. Identification of patterns through Haskell programs analysis
Quesada et al. Parsing abstract syntax graphs with ModelCC

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant