CN114564624A - 特征匹配规则构建、特征匹配方法、装置、设备及介质 - Google Patents

特征匹配规则构建、特征匹配方法、装置、设备及介质 Download PDF

Info

Publication number
CN114564624A
CN114564624A CN202210130341.5A CN202210130341A CN114564624A CN 114564624 A CN114564624 A CN 114564624A CN 202210130341 A CN202210130341 A CN 202210130341A CN 114564624 A CN114564624 A CN 114564624A
Authority
CN
China
Prior art keywords
rule
sub
node
text string
feature matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210130341.5A
Other languages
English (en)
Inventor
李�瑞
沈志嵘
王述振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN202210130341.5A priority Critical patent/CN114564624A/zh
Publication of CN114564624A publication Critical patent/CN114564624A/zh
Priority to PCT/CN2022/112610 priority patent/WO2023151252A1/zh
Priority to TW111133532A priority patent/TWI844091B/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Machine Translation (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种特征匹配规则构建、特征匹配方法、装置、设备及介质,用以提高特征匹配效率。本申请针对每个子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素均不相同时,才在当前特征匹配规则树中建立该第一要素对应的第一节点、及与该第一要素存在关联的目标第一逻辑关系词对应的第二节点,并连接该第一节点和该第二节点。由于本申请特征匹配规则树中不包含重复的节点(节点组),各个子规则文本串的规则标识信息之间可以共用相同的节点(节点组);在进行特征匹配时,各个规则标识信息之间可以共用相同的节点(节点组)对账户特征数据的匹配信息,从而可以避免重复计算(匹配),提高特征匹配效率。

Description

特征匹配规则构建、特征匹配方法、装置、设备及介质
技术领域
本申请涉及特征匹配技术领域,尤其涉及一种特征匹配规则构建、特征匹配方法、装置、设备及介质。
背景技术
目前,在确定用户的数据(为方便描述,称为账户特征数据)适用的交换费、计费代码等(为方便描述,称为结果值)时,通常需要基于行列矩阵结构来构建特征匹配规则,特征匹配规则中通常包含多个子规则,可以通过将账户特征数据与多个子规则分别进行匹配(为方便描述,称为特征匹配),确定与账户特征数据适用(匹配)的子规则,进而得出账户特征数据适用的交换费、计费代码等结果值。
然而,由于行列矩阵结构往往具有稀疏矩阵的特性等,基于行列矩阵结构构建的特征匹配规则中包含的多个子规则之间通常包含有相同的子判断条件,即相同的子判断条件通常在特征匹配规则中重复出现,这就使得在将账户特征数据与多个子规则分别进行匹配时,通常存在重复计算(匹配),从而导致特征匹配效率通常较低。
因此,亟需一种可以提高特征匹配效率的技术方案。
发明内容
本申请提供了一种特征匹配规则构建、特征匹配方法、装置、设备及介质,用以提高特征匹配效率。
第一方面,本申请提供了一种特征匹配规则构建方法,所述方法包括:
针对接收到的每个子规则文本串,确定该子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词;针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同;若是,则在当前特征匹配规则树中建立该第一要素对应的第一节点;识别该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词,在当前特征匹配规则树中建立该目标第一逻辑关系词对应的第二节点,并连接该第一节点和该第二节点,保存该子规则文本串的规则标识信息与该第一要素及与所述目标第一逻辑关系词之间的对应关系。
在一种可能的实施方式中,所述方法还包括:
若该第一要素与当前特征匹配规则树中包含的目标子规则文本串的第二要素相同,判断当前特征匹配规则树中与所述第二要素连接的第二逻辑关系词是否与该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词相同;
若是,则将当前特征匹配规则树中,所述第二要素对应的节点及所述第二逻辑关系词对应的节点所组成的节点组确定为该子规则文本串的规则标识信息与所述目标子规则文本串的规则标识信息的共用节点组;保存该子规则文本串的规则标识信息与所述第二要素及与所述第二逻辑关系词之间的对应关系;
若否,则将当前特征匹配规则树中,所述第二要素对应的节点确定为该子规则文本串的规则标识信息与所述目标子规则文本串的规则标识信息的共用节点;在当前特征匹配规则树中建立所述目标第一逻辑关系词对应的第二节点,并连接该第二节点与所述第二要素对应的节点,保存该子规则文本串的规则标识信息与所述第二要素及与所述目标第一逻辑关系词之间的对应关系。
在一种可能的实施方式中,所述确定该子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词包括:
识别该子规则文本串中包含的预设的分隔符,基于所述分隔符,将该子规则文本串分割为多个词素;
针对每个词素,根据预先保存的词素与词素类型的对应关系,确定该词素对应的目标词素类型;基于所述目标词素类型,确定该词素为第一要素或者为与第一要素存在关联的第一逻辑关系词。
在一种可能的实施方式中,所述确定该子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词之后,所述针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同之前,所述方法还包括:
基于上下文无关文法及递归下降算法,对该子规则文本串进行语法分析;若该子规则文本串的语法分析结果为合格,则进行后续步骤。
在一种可能的实施方式中,若该子规则文本串的语法分析结果为合格,所述针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同之前,所述方法还包括:
将该第一要素作为该子规则文本串对应的子规则树中包含的第一子节点,将所述目标第一逻辑关系词作为所述子规则树中包含的第二子节点,将在所述子规则文本串中存在关联关系的第一子节点与第二子节点之间进行连接,建立该子规则文本串对应的子规则树;基于该子规则树,进行后续针对该子规则文本串对应的子规则树中包含的任一第一要素对应的第一子节点,判断该第一子节点的第一要素与当前特征匹配规则树中包含的任一节点的要素是否均不相同的步骤。
在一种可能的实施方式中,所述建立该子规则文本串对应的子规则树之后,所述基于该子规则树,进行后续针对该子规则文本串对应的子规则树中包含的任一第一要素对应的第一子节点,判断该第一子节点的第一要素与当前特征匹配规则树中包含的任一节点的要素是否均不相同的步骤之前,所述方法还包括:
基于预设的谓词推演算法及子节点排序规则,对该子规则树中包含的子节点及子节点的排序顺序进行整理。
在一种可能的实施方式中,所述第一要素包括:单例要素或衍生要素。
第二方面,本申请还提供了一种特征匹配方法,所述方法包括:
接收账户特征数据,确定所述账户特征数据中包含的每个第三要素及与第三要素存在关联的第三逻辑关系词;
根据特征匹配规则树中包含的每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息;
将预设的所述目标规则标识信息对应的目标结果值确定为所述账户特征数据适用的结果值。
在一种可能的实施方式中,所述根据特征匹配规则树中包含的每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息包括:
针对任一规则标识信息对应的每个节点,判断该节点是否为该规则标识信息与其他规则标识信息的共用节点或共用节点组中的节点;
若是,且如果当前保存有其他规则标识信息的该共用节点或共同节点组对所述账户特征数据的匹配信息,则直接将所述匹配信息,作为该节点或该节点所在的共用节点组对所述账户特征数据的匹配信息;如果当前未保存有其他规则标识信息的该共用节点或共同节点组对所述账户特征数据的匹配信息,则将该节点或该节点所在的共用节点组与所述账户特征数据中对应的第三要素和/或第三逻辑关系词进行匹配,确定该节点或该节点所在的共用节点组对所述账户特征数据的匹配信息,并保存;
若否,则将该节点与所述账户特征数据中对应的第三要素或第三逻辑关系词进行匹配,确定该节点对所述账户特征数据的匹配信息;
将规则标识信息对应的每个节点对所述账户特征数据的匹配信息均为匹配的规则标识信息,确定为所述目标规则标识信息。
在一种可能的实施方式中,所述根据特征匹配规则树中包含的每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息包括:
根据为特征匹配规则树中包含的每个规则标识信息预设的优先级的先后顺序,依次根据每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息。
第三方面,本申请还提供了一种特征匹配规则构建装置,所述装置包括:
第一确定模块,用于针对接收到的每个子规则文本串,确定该子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词;
构建模块,用于针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同;若是,则在当前特征匹配规则树中建立该第一要素对应的第一节点;识别该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词,在当前特征匹配规则树中建立该目标第一逻辑关系词对应的第二节点,并连接该第一节点和该第二节点,保存该子规则文本串的规则标识信息与该第一要素及与所述目标第一逻辑关系词之间的对应关系。
在一种可能的实施方式中,所述构建模块,还用于若该第一要素与当前特征匹配规则树中包含的目标子规则文本串的第二要素相同,判断当前特征匹配规则树中与所述第二要素连接的第二逻辑关系词是否与该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词相同;
若是,则将当前特征匹配规则树中,所述第二要素对应的节点及所述第二逻辑关系词对应的节点所组成的节点组确定为该子规则文本串的规则标识信息与所述目标子规则文本串的规则标识信息的共用节点组;保存该子规则文本串的规则标识信息与所述第二要素及与所述第二逻辑关系词之间的对应关系;
若否,则将当前特征匹配规则树中,所述第二要素对应的节点确定为该子规则文本串的规则标识信息与所述目标子规则文本串的规则标识信息的共用节点;在当前特征匹配规则树中建立所述目标第一逻辑关系词对应的第二节点,并连接该第二节点与所述第二要素对应的节点,保存该子规则文本串的规则标识信息与所述第二要素及与所述目标第一逻辑关系词之间的对应关系。
在一种可能的实施方式中,所述第一确定模块,具体用于识别该子规则文本串中包含的预设的分隔符,基于所述分隔符,将该子规则文本串分割为多个词素;
针对每个词素,根据预先保存的词素与词素类型的对应关系,确定该词素对应的目标词素类型;基于所述目标词素类型,确定该词素为第一要素或者为与第一要素存在关联的第一逻辑关系词。
在一种可能的实施方式中,所述构建模块,还用于基于上下文无关文法及递归下降算法,对该子规则文本串进行语法分析;若该子规则文本串的语法分析结果为合格,则进行后续所述针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同的步骤。
在一种可能的实施方式中,所述构建模块,还用于将该第一要素作为该子规则文本串对应的子规则树中包含的第一子节点,将所述目标第一逻辑关系词作为所述子规则树中包含的第二子节点,将在所述子规则文本串中存在关联关系的第一子节点与第二子节点之间进行连接,建立该子规则文本串对应的子规则树;基于该子规则树,进行后续针对该子规则文本串对应的子规则树中包含的任一第一要素对应的第一子节点,判断该第一子节点的第一要素与当前特征匹配规则树中包含的任一节点的要素是否均不相同的步骤。
在一种可能的实施方式中,所述构建模块,还用于基于预设的谓词推演算法及子节点排序规则,对该子规则树中包含的子节点及子节点的排序顺序进行整理。
第四方面,本申请还提供了一种特征匹配装置,所述装置包括:
第二确定模块,用于接收账户特征数据,确定所述账户特征数据中包含的每个第三要素及与第三要素存在关联的第三逻辑关系词;
第三确定模块,用于根据特征匹配规则树中包含的每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息;
第四确定模块,用于将预设的所述目标规则标识信息对应的目标结果值确定为所述账户特征数据适用的结果值。
在一种可能的实施方式中,所述第三确定模块,具体用于针对任一规则标识信息对应的每个节点,判断该节点是否为该规则标识信息与其他规则标识信息的共用节点或共用节点组中的节点;
若是,且如果当前保存有其他规则标识信息的该共用节点或共同节点组对所述账户特征数据的匹配信息,则直接将所述匹配信息,作为该节点或该节点所在的共用节点组对所述账户特征数据的匹配信息;如果当前未保存有其他规则标识信息的该共用节点或共同节点组对所述账户特征数据的匹配信息,则将该节点或该节点所在的共用节点组与所述账户特征数据中对应的第三要素和/或第三逻辑关系词进行匹配,确定该节点或该节点所在的共用节点组对所述账户特征数据的匹配信息,并保存;
若否,则将该节点与所述账户特征数据中对应的第三要素或第三逻辑关系词进行匹配,确定该节点对所述账户特征数据的匹配信息;
将规则标识信息对应的每个节点对所述账户特征数据的匹配信息均为匹配的规则标识信息,确定为所述目标规则标识信息。
在一种可能的实施方式中,所述第三确定模块,具体用于根据为特征匹配规则树中包含的每个规则标识信息预设的优先级的先后顺序,依次根据每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息。
第五方面,本申请还提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述特征匹配规则构建方法的步骤,或,实现如上述任一所述特征匹配方法的步骤。
第六方面,本申请还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述特征匹配规则构建方法的步骤,或,实现如上述任一所述特征匹配方法的步骤。
第七方面,本申请提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行如上述任一所述特征匹配规则构建方法的步骤,或,实现如上述任一所述特征匹配方法的步骤。
由于本申请实施例中,特征匹配规则树中包含的各个子规则文本串的规则标识信息之间可以共用相同的节点;在进行特征匹配时,各个规则标识信息之间可以共用相同的节点(共用节点或共用节点组)对账户特征数据的匹配信息,从而可以避免重复计算(匹配),提高特征匹配效率。
附图说明
为了更清楚地说明本申请实施例或相关技术中的实施方式,下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1示出了一些实施例提供的第一种特征匹配规则构建过程示意图;
图2示出了一些实施例提供的一种词素属性信息示意图;
图3示出了一些实施例提供的产生式模型示意图;
图4示出了一些实施例提供的一种子规则树示意图;
图5a示出了一些实施例提供的一种整理前子规则树示意图;
图5b示出了一些实施例提供的一种整理后的子规则树示意图;
图6a示出了一些实施例提供的另一种整理前子规则树示意图;
图6b示出了一些实施例提供的另一种整理后的子规则树示意图;
图7a示出了一些实施例提供的一种当前特征匹配规则树示意图;
图7b示出了一些实施例提供的一种子规则字符串的子规则树示意图;
图7c示出了一些实施例提供的一种更新后的特征匹配规则树示意图;
图8a示出了一些实施例提供的另一种子规则字符串的子规则树示意图;
图8b示出了一些实施例提供的另一种更新后的特征匹配规则树示意图;
图9a中示出了一些实施例提供的一种转置前的规则1和规则2的子规则树示意图;
图9b示出了一些实施例提供的一种将规则1和规则2的子规则树转置后示意图;
图9c示出了一些实施例提供的一种将规则1和规则2的子规则树合并后形成的特征匹配规则树示意图;
图10示出了一些实施例提供的一种特征匹配过程示意图;
图11示出了一些实施例提供的一种特征匹配规则构建装置示意图;
图12示出了一些实施例提供的一种特征匹配装置示意图;
图13示出了一些实施例提供的一种电子设备结构示意图。
具体实施方式
为了提高特征匹配效率,本申请提供了一种特征匹配规则构建、特征匹配方法、装置、设备及介质。
为使本申请的目的和实施方式更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。
实施例1:
图1示出了一些实施例提供的第一种特征匹配规则构建过程示意图,该过程包括以下步骤:
S101:针对接收到的每个子规则文本串,确定该子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词。
本申请实施例提供的特征匹配规则构建方法应用于电子设备,该电子设备例如可以是PC、移动终端等设备,也可以是服务器等设备。
在一种可能的实施方式中,开发人员等可以将每个可能适用的规则(子规则)配置为对应的文本串(为方便描述,称为子规则文本串),其中,子规则文本串可以根据需求灵活设置,本申请对此不作具体限定,示例性的,子规则文本串可以为“南卡北用&发卡&商务卡&gt840-2000&B001非TE”等。电子设备可以接收开发人员等配置的子规则文本串,并可以针对接收到的每个子规则文本串,确定该子规则文本串中包含的每个要素(为方便描述,称为第一要素)及与第一要素存在关联的逻辑关系词(为方便描述,称为第一逻辑关系词)。其中,子规则文本串中包含的第一要素及第一逻辑关系词可以根据需求灵活设置,本申请对此不作具体限定。示例性的,第一要素可以为单例要素,也可以为由多个单例要素组合成的衍生要素等。第一逻辑关系词可以包括加(+)、减(-)、乘(*)、除(/)、大于(>)、大于等于(≥)、小于(<)、小于等于(≤)、属于(in)等运算符,也可以包括与(&)、或(|)、非(!)、括号等逻辑符。
在一种可能的实施方式中,在确定子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词时,可以先识别该子规则文本串中包含的预设的分隔符,基于该分隔符,将子规则文本串分割为多个词素,然后针对每个词素,可以根据预先保存的词素与词素类型的对应关系,确定该词素对应的词素类型(为方便描述,称为目标词素类型)。可以基于目标词素类型,确定该词素为第一要素还是为第一逻辑关系词。
示例性的,仍以上述子规则文本串为“南卡北用&发卡&商务卡&gt840-2000&B001非TE”为例,如果预设的分隔符为空格,则可以将上述子规则文本串划分为南卡北用、&、发卡、&、商务卡、&、gt840-2000、&、B001非TE等多个词素。得到子规则文本串中包含的各个词素后,可以针对每个词素,根据预先保存的词素与词素类型的对应关系,确定该词素对应的目标词素类型。图2示出了一些实施例提供的一种词素属性信息示意图,如图2所示,示例性的,如果预先保存了南卡北用与词素类型(为方便描述,图中称为类型)为要素(单例要素)的对应关系,则可以将南卡北用确定为第一要素。如果预先保存了&与词素类型为逻辑关系词(与)的对应关系,则可以将&确定为逻辑关系词(与)。可以理解的,针对发卡、商务卡、gt840-2000、B001非TE,如果预先分别保存了发卡与词素类型为要素(单例要素)的对应关系、商务卡与词素类型为要素(单例要素)的对应关系、gt840-2000与词素类型为要素(单例要素)的对应关系、B001非TE与词素类型为要素(单例要素)的对应关系,则可以将发卡、商务卡、gt840-2000、B001非TE分别确定为第一要素。
在一种可能的实施方式中,如果子规则文本串中包含多余的空格和换行符,可以将子规则文本串中多余的空格和换行符进行去除(清洗)后,再基于预设的分隔符,将子规则文本串分割为多个词素。
S102:针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同;若是,则进行S103;若否,则进行S104。
考虑到开发人员等编写的子规则文本串需要满足设定的语法要求(如子规则文本串中包含的左括号和右括号需要成对的出现,即左括号和右括号的数量需要相同等),方能可以基于该子规则文本串准确的进行特征匹配。在一种可能的实施方式中,确定了子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词之后,针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同之前,还可以基于上下文无关文法及递归下降算法(语法分析器),对该子规则文本串进行语法分析,如果该子规则文本串的语法分析结果为合格,则可以进行后续针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同(即将该子规则文本串融入特征匹配规则树)的步骤。
可以理解的,如果子规则文本串的语法分析结果为不合格,则可以输出设定的提示信息,提示开发人员等对子规则文本串进行修正。
为方便理解,下面通过一个具体实施例对本申请实施例提供的对该子规则文本串进行语法分析的过程进行举例说明。
在一种可能的实施方式中,除了确定子规则文本串中每个词素的词素类型之外,还可以确定子规则文本串中每个词素(如要素)的表达式、左操作数、操作符、右操作数等属性参数。为方便描述,将词素的词素类型、表达式、左操作数、操作符、右操作数等称为词素属性参数。针对每个词素,可以根据预先保存的词素与词素属性参数的对应关系,确定该词素对应的目标词素属性参数,仍参阅图2,可以基于目标词素属性参数,确定该词素的每个词素属性参数。其中,确定词素的表达式等词素属性参数的过程与确定词素的词素类型的过程相同,在此不再赘述。
在一种可能的实施方式中,可以按照每个词素在子规则文本串中的顺序,对每个词素进行排序,为方便描述,将排序后的词素称为词法单元序列。在一种可能的实施方式中,可以将基于上下文无关文法创建的模型称为产生式模型G=(N,Σ,P,S)。示例性的,图3示出了一些实施例提供的产生式模型示意图,如图3所示,可以基于由上下文无关文法创建的产生式模型,对子规则文本串进行语法分析并生成该子规则文本串对应的子规则树。示例性的,在基于由上下文无关文法创建的产生式模型,对子规则文本串进行语法分析时,可以按顺序读取子规则文本串对应的词法单元序列中的每个词素,并可以采用自顶向下的递归下降算法,并每次前看一个符号,用前看符号指导语法规则(分析函数)的选择,确定每一个词素适用的一种分析函数。示例性的,分析函数共有5种,分别为:表达式分析函数expr()、或分析函数or()、与左分析函数andLeftCond()、与右分析函数andRightCond()、非分析函数notCond()。每种分析函数可以按照常规递归下降算法进行处理。
在一种可能的实施方式中,为了提高将子规则文本串融合特征匹配规则树的效率,当子规则文本串对应的词法单元序列被遍历完成后,如果该子规则文本串满足设定的语法要求,即语法分析结果为合格时,可以基于语法分析器同时生成(建立)该子规则文本串对应的规则树(为方便描述,称为子规则树)。
具体的,建立子规则文本串对应的子规则树的过程可以包括:
将子规则文本串中包含的每个第一要素均分别作为该子规则文本串对应的子规则树中包含的一个节点(为方便描述,称为第一子节点),将子规则文本串中的目标第一逻辑关系词也分别作为子规则树中包含的一个节点(为方便描述,称为第二子节点),并可以将在子规则文本串中存在关联关系的第一子节点与第二子节点之间进行连接,从而建立该子规则文本串对应的子规则树。
在一种可能的实施方式中,在建立子规则文本串对应的子规则树时,如果遇到子规则文本串的词法单元序列中的词素适用的分析函数为或分析函数or()、与右分析函数andLeftCond()、非分析函数notCond()等时,可以分别在子规则树中同时建立新增匹配中间节点or(或)、and(且)、or(或)等,如果遇到子规则文本串的词法单元序列中词素(要素)为终结符(TOK_COND)时,则可以在关联中间节点的下层中新增一个对应的叶子节点。示例性的,图4示出了一些实施例提供的一种子规则树示意图,假设子规则文本串为:单例要素1|单例要素2(单例要素3&衍生要素1&衍生要素2&!(单例要素4&衍生要素3)&(单例要素5|衍生要素4)),则该子规则文本串对应的子规则树可以为如图4所示的子规则树。其中,为方便描述,图中均将单例要素1称为单例1、将单例要素2称为单例2、将单例要素3称为单例3、将衍生要素1称为衍生1、将衍生要素2称为衍生2、将单例要素4称为单例4、将衍生要素3称为衍生3、将单例要素5称为单例5、将衍生要素4称为衍生4。
建立了子规则文本串对应的子规则树后,可以基于该子规则树,将子规则文本串(子规则树)融入特征匹配规则树中。具体的,可以将每个子规则文本串(子规则树)均合并(融入)到同一个特征匹配规则树中。为了后续在进行特征匹配时,可以提高匹配效率,避免重复计算(匹配),针对每个子规则文本串(子规则树),在将该子规则文本串(子规则树)的任一第一要素合并到特征匹配规则树中时,可以先针对子规则文本串对应的子规则树中包含的任一第一要素对应的第一子节点,判断该第一子节点的第一要素与当前特征匹配规则树中包含的任一节点的要素是否均不相同。
在一种可能的实施方式中,为了提高将子规则文本串(子规则树)融入到特征匹配规则树中的效率,以及为了快捷准确地识别子规则文本串之间的共用节点及共用节点组,建立该子规则文本串对应的子规则树之后,基于该子规则树,进行后续针对该子规则文本串对应的子规则树中包含的任一第一要素对应的第一子节点,判断该第一子节点的第一要素与当前特征匹配规则树中包含的任一节点的要素是否均不相同的步骤之前,还可以基于预设的谓词推演算法及子节点排序规则,对该子规则树中包含的子节点及子节点的排序顺序进行整理。
示例性的,基于预设的谓词推演算法及子节点排序规则,对子规则树中包含的子节点进行整理时,可以将非(!)运算的节点进行下推。示例性的,图5a示出了一些实施例提供的一种整理前子规则树示意图,图5b示出了一些实施例提供的一种整理后的子规则树示意图,具体的,如果非(!)运算连接的下层的子节点有多个,则可以将非(!)运算下推到下一层子节点中,其中,原下一层中的“与运算”(&)和“或运算”(|)进行互换后上移一层。
再示例性的,基于预设的谓词推演算法及子节点排序规则,对子规则树中包含的子节点进行整理时,还可以将节点上移。示例性的,图6a示出了一些实施例提供的另一种整理前子规则树示意图,图6b示出了一些实施例提供的另一种整理后的子规则树示意图,具体的,如果当前运算符(逻辑关系词)所在的节点与父节点的运算符(逻辑关系词)一致时,则可以将当前运算符的子节点上移,并删除当前运算符所在的节点(子节点)。
再示例性的,基于预设的谓词推演算法及子节点排序规则,对子规则树中包含的子节点进行整理时,可以按照处于同一层的各个叶子节点(参阅图6a,针对单例1、单例2、且这一层,可以将单例1和单例2称为叶子节点)对应的要素的字段ID等唯一属性,对各个叶子节点进行升序排序或降序排序。另外,可以将处于同一层的非叶子节点(参阅图6a,针对单例1、单例2、且这一层,可以将“且”称为非叶子节点)的排在叶子节点的后面,如果同一层的非叶子节点有多个,可以按照非叶子节点下一层的子节点对应的要素的字段ID等唯一属性,对同一层的多个非叶子节点进行排序。
S103:在当前特征匹配规则树中建立该第一要素对应的第一节点;识别该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词,在当前特征匹配规则树中建立该目标第一逻辑关系词对应的第二节点,并连接该第一节点和该第二节点,保存该子规则文本串的规则标识信息与该第一要素及与所述目标第一逻辑关系词之间的对应关系。
在一种可能的实施方式中,如果第一要素与当前特征匹配规则树中包含的任一要素均不相同,则可以认为当前特征匹配规则树中尚未包含该第一要素,则可以将该第一要素添加到当前特征匹配规则树中。具体的,可以在当前特征匹配规则树中建立该第一要素对应的节点(为方便描述,称为第一节点),并识别该子规则文本串中与该第一要素存在关联的第一逻辑关系词(为方便描述,称为目标第一逻辑关系词),在当前特征匹配规则树中建立该目标第一逻辑关系词对应的节点(为方便描述,称为第二节点),并可以将该第一节点和该第二节点进行连接,在一种可能的实施方式中,为了区分各个子规则文本串对应的要素及逻辑关系词,提高匹配准确性,还可以保存该子规则文本串的标识信息(为方便描述,称为规则标识信息)与该第一要素及与目标第一逻辑关系词之间的对应关系。其中,规则标识信息可以根据需求灵活设置,本申请不作具体限定。
S104:若该第一要素与当前特征匹配规则树中包含的目标子规则文本串的第二要素相同,判断当前特征匹配规则树中与所述第二要素连接的第二逻辑关系词是否与该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词相同;若是,则将当前特征匹配规则树中,所述第二要素对应的节点及所述第二逻辑关系词对应的节点所组成的节点组确定为该子规则文本串的规则标识信息与所述目标子规则文本串的规则标识信息的共用节点组;保存该子规则文本串的规则标识信息与所述第二要素及与所述第二逻辑关系词之间的对应关系;若否,则将当前特征匹配规则树中,所述第二要素对应的节点确定为该子规则文本串的规则标识信息与所述目标子规则文本串的规则标识信息的共用节点;在当前特征匹配规则树中建立所述目标第一逻辑关系词对应的第二节点,并连接该第二节点与所述第二要素对应的节点,保存该子规则文本串的规则标识信息与所述第二要素及与所述目标第一逻辑关系词之间的对应关系。
在一种可能的实施方式中,针对每个子规则文本串,在将该子规则文本串的任一第一要素合并到特征匹配规则树中时,如果判断该第一要素与当前特征匹配规则树中包含的另一个子规则文本串(为方便描述,称为目标子规则文本串)中的一个要素(为方便描述,称为第二要素)相同,则可以认为当前特征匹配规则树中已经包含了该第一要素,可以不再将该第一要素添加到特征匹配规则树中。在一种可能的实施方式中,可以继而判断当前特征匹配规则树中与第二要素连接的逻辑关系词(为方便描述,称为第二逻辑关系词)是否与该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词相同。
如果当前特征匹配规则树中与第二要素连接的第二逻辑关系词与该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词相同,则可以将当前特征匹配规则树中,第二要素对应的节点及第二逻辑关系词对应的节点所组成的节点组确定为该子规则文本串的规则标识信息与目标子规则文本串的规则标识信息的共用节点组,并保存该子规则文本串的规则标识信息与第二要素及与第二逻辑关系词之间的对应关系。
为方便理解,下面通过一个具体实施例对本申请提供的特征匹配规则构建过程进行举例说明。图7a示出了一些实施例提供的一种当前特征匹配规则树示意图,如图7a所示,当前特征匹配规则树中包含的子规则字符串的规则标识信息为“规则1”,图7b示出了一些实施例提供的一种子规则字符串的子规则树示意图,假设子规则字符串的规则标识信息为“规则2”,规则2的子规则树如图7b所示,由于规则1和规则2中均包含“单例要素3&(且)衍生要素1”节点,可以将其中“单例要素3&(且)衍生要素1”作为规则1和规则2的共用节点组(完全重合片段),则在包含规则1的当前特征匹配规则树中融入规则2的子规则树后,当前特征匹配规则树变更为如图7c所示的特征匹配规则树。
再示例性的,图8a示出了一些实施例提供的另一种子规则字符串的子规则树示意图,假设子规则字符串的规则标识信息为“规则3”,规则3的子规则树如图8a所示,假设当前特征匹配规则树中包含如图7a所示的规则1的子规则树,则规则1和规则3中包含部分重合片段,可以将“单例要素1或单例要素2或单例要素4”节点作为规则1和规则3的共用节点组,示例性的,在包含规则1的当前特征匹配规则树中融入规则3的子规则树后,当前特征匹配规则树变更为如图8b所示的特征匹配规则树。
再示例性的,参阅图9a,图9a中示出了一些实施例提供的一种转置前的规则1和规则2的子规则树示意图。图9b示出了一些实施例提供的一种将规则1和规则2的子规则树转置后示意图,即将规则标识信息转置到最下层,将要素转置为最上层。示例性的,南卡北用属于一种交易模式,发卡属于一种机构角色,商户卡属于一种卡产品,借记卡和贷记卡分别属于一种卡性质。图9c示出了一些实施例提供的一种将规则1和规则2的子规则树合并后形成的特征匹配规则树示意图,如图9c所示,可以将“南卡北用&(且)发卡&商户卡”作为规则1和规则2的公共节点组(公共片段)。
在一种可能的实施方式中,针对子规则文本串中包含的任一第一要素,如果该第一要素与当前特征匹配规则树中包含的目标子规则文本串的第二要素相同,但是当前特征匹配规则树中与第二要素连接的第二逻辑关系词与该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词不相同,则可以将当前特征匹配规则树中,第二要素对应的节点确定为该子规则文本串的规则标识信息与目标子规则文本串的规则标识信息的共用节点;并在当前特征匹配规则树中建立目标第一逻辑关系词对应的第二节点,连接该第二节点与第二要素对应的节点,并保存该子规则文本串的规则标识信息与第二要素及与目标第一逻辑关系词之间的对应关系。
由于本申请实施例中,特征匹配规则树中包含的各个子规则文本串的规则标识信息之间可以共用相同的节点,即特征匹配规则树中不存在重复的节点,从而可以在后续进行特征匹配时,使得各个规则标识信息之间可以共用相同的节点(共用节点或共用节点组)对账户特征数据的匹配信息,从而可以避免重复计算(匹配),提高特征匹配效率。
实施例2:
基于相同的技术构思,本申请提供了一种特征匹配方法,图10示出了一些实施例提供的一种特征匹配过程示意图,如图10所示,该过程包括以下步骤:
S1001:接收账户特征数据,确定所述账户特征数据中包含的每个第三要素及与第三要素存在关联的第三逻辑关系词。
本申请实施例提供的特征匹配方法应用于电子设备,该电子设备例如可以是PC、移动终端等设备,也可以是服务器等设备。
电子设备可以接收待进行特征匹配的账户特征数据,为了快捷准确地进行特征匹配,电子设备可以确定账户特征数据中包含的每个要素(为方便描述,称为第三要素)及第三要素存在关联的逻辑关系词(为方便描述,称为第三逻辑关系词)。其中,确定账户特征数据中包含的要素及逻辑关系词的过程与上述实施例中确定子规则文本串中包含的要素及逻辑关系词的过程相同,在此不再赘述。
S1002:根据特征匹配规则树中包含的每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息。
在一种可能的实施方式中,在进行特征匹配时,针对特征匹配规则树中包含的每个规则标识信息,可以根据特征匹配规则树中该规则标识信息与要素及逻辑关系词之间的对应关系,将该规则标识信息对应的每个要素及逻辑关系词与账户特征数据中包含的每个第三要素及第三逻辑关系词进行特征匹配(为方便描述,称为将规则标识信息与账户特征数据进行特征匹配),判断该规则标识信息是否为与账户特征数据匹配的规则标识信息,如果该规则标识信息与账户特征数据匹配,则将该规则标识信息确定为与账户特征数据匹配的规则标识信息(为方便描述,称为目标规则标识信息)。
可选的,为了提高匹配效率,开发人员等可以预先为特征匹配规则树中包含的每个规则标识信息配置对应的优先级,电子设备可以根据为特征匹配规则树中包含的每个规则标识信息预设的优先级的先后顺序,依次将每个规则标识信息分别与账户特征数据进行特征匹配。示例性的,假设特征匹配规则树中包含“规则1”和“规则2”两个规则标识信息,“规则1”的优先级高于“规则2”,则可以先将“规则1”与账户特征数据进行匹配,判断“规则1”是否为与账户特征数据匹配的目标规则标识信息;如果“规则1”与账户特征数据匹配,则将“规则1”确定为目标规则标识信息。如果“规则1”与账户特征数据不匹配,则可以继而将“规则2”与账户特征数据进行匹配,判断“规则2”是否为与账户特征数据匹配的目标规则标识信息,如果“规则2”与账户特征数据匹配,则将“规则2”确定为目标规则标识信息。
在一种可能的实施方式中,在将任一规则标识信息对应的每个要素及逻辑关系词与账户特征数据中包含的每个第三要素及第三逻辑关系词进行特征匹配(规则标识信息与账户特征数据进行特征匹配),判断该规则标识信息是否为与账户特征数据匹配的目标规则标识信息时,可以是针对任一规则标识信息对应的每个节点,判断该节点是否为该规则标识信息与其他规则标识信息的共用节点或共用节点组中的节点。如果该节点为该规则标识信息与其他规则标识信息的共用节点或共用节点组中的节点,可以继而判断当前是否保存有其他规则标识信息的该共用节点或共同节点组对账户特征数据的匹配信息。
如果当前保存有其他规则标识信息的该共用节点或共同节点组对所述账户特征数据的匹配信息,则可以认为其他规则标识信息已经与账户特征数据进行了特征匹配,可以直接将该匹配信息,作为该节点或该节点所在的共用节点组对账户特征数据的匹配信息。
而如果当前尚未保存有其他规则标识信息的该共用节点或共同节点组对所述账户特征数据的匹配信息,则可以认为其他规则标识信息尚未与账户特征数据进行特征匹配,示例性的,可以将该规则标识信息的节点或该节点所在的共用节点组与账户特征数据中的第三要素和/或第三逻辑关系词进行匹配,确定该节点或该节点所在的共用节点组对账户特征数据的匹配信息。为了便于后续其他规则标识信息与账户特征数据进行特征匹配时,可以提高特征匹配效率,可以将该匹配信息进行保存(缓存),后续其他规则标识信息在于账户特征数据进行特征匹配时,可以直接将该匹配信息,作为该节点或该节点所在的共用节点组对账户特征数据的匹配信息,而无需在将该节点或该节点所在的共用节点组与账户特征数据中对应的第三要素和/或第三逻辑关系词进行匹配,确定该节点或该节点所在的共用节点组对账户特征数据的匹配信息,从而可以提高特征匹配效率。
可以理解的,针对任一规则标识信息对应的每个节点,如果该节点不是该规则标识信息与其他规则标识信息的共用节点或共用节点组中的节点,则将该节点与账户特征数据中对应的第三要素或第三逻辑关系词进行匹配,确定该节点对账户特征数据的匹配信息。
示例性的,参阅图9c,针对卡性质这个节点,如果账户特征数据中卡性质对应的第三要素为“贷记卡”,则可以确定规则1中的卡性质这个节点(借记卡)与账户特征数据的匹配信息为不匹配,而规则2中卡性质这个节点(贷记卡)与账户特征数据的匹配信息为匹配。
在一种可能的实施方式中,如果任一规则标识信息对应的每个节点对账户特征数据的匹配信息均为匹配时,则可以将该规则标识信息,确定为与账户特征数据匹配的目标规则标识信息。
S1003:将预设的所述目标规则标识信息对应的目标结果值确定为所述账户特征数据适用的结果值。
在一种可能的实施方式中,可以预先设置每个规则标识信息与结果值的对应关系,在确定了目标规则标识信息后,可以将预设的目标规则标识信息对应的结果值(目标结果值)确定为账户特征数据适用的结果值。
由于本申请实施例中,特征匹配规则树中包含的各个子规则文本串的规则标识信息之间可以共用相同的节点;在进行特征匹配时,各个规则标识信息之间可以共用相同的节点(共用节点或共用节点组)对账户特征数据的匹配信息,从而可以避免重复计算(匹配),提高特征匹配效率。
另外,相比相关技术中,采用的行列矩阵结构中通常存在大量的通配值,采用笛卡尔积配置方式进行特征匹配时,匹配次数(参数量)膨胀很快,且在特征匹配过程中如果每次均需要将账户特征数据与通配值进行匹配,而通配值通常对匹配结果(结果值)无影响,因此就会导致在特征匹配过程中存在很多无效运算(匹配),从而影响特征匹配效率及系统性能。而本申请实施例中特征匹配规则树中通常不包含有通配值,从而可以提高特征匹配效率。
另外,相关技术的行列矩阵结构中往往含有固定的列字段,而列字段之间往往存在固定的顺序,导致行列矩阵结构的扩展性低,难以基于基本列字段灵活衍生新字段生成新的子规则。而本申请可以将开发人员等配置的新的子规则文本串,快捷灵活的融入到特征匹配规则树,从而可以快捷灵活的提高子规则的扩展性。另外,相关技术中行列矩阵结构的列字段顺序固定,从而导致进行特征匹配时的子规则之间的先后顺序固定,无法按照实际情况灵活调整匹配顺序,而本申请实施例可以灵活调整特征匹配规则树中包含的每个规则标识信息的优先级先后顺序,从而可以实现灵活调整匹配顺序的目的。
另外,本申请中的第一要素可以为由多个单例要素组合成的衍生要素,可以直接复用衍生要素对账户特征数据的匹配信息,从而可以进一步提高特征匹配效率。
实施例3:
基于相同的技术构思,本申请提供了一种特征匹配规则构建装置,图11示出了一些实施例提供的一种特征匹配规则构建装置示意图,如图11所示,所述装置包括:
第一确定模块111,用于针对接收到的每个子规则文本串,确定该子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词;
构建模块112,用于针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同;若是,则在当前特征匹配规则树中建立该第一要素对应的第一节点;识别该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词,在当前特征匹配规则树中建立该目标第一逻辑关系词对应的第二节点,并连接该第一节点和该第二节点,保存该子规则文本串的规则标识信息与该第一要素及与所述目标第一逻辑关系词之间的对应关系。
在一种可能的实施方式中,所述构建模块112,还用于若该第一要素与当前特征匹配规则树中包含的目标子规则文本串的第二要素相同,判断当前特征匹配规则树中与所述第二要素连接的第二逻辑关系词是否与该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词相同;
若是,则将当前特征匹配规则树中,所述第二要素对应的节点及所述第二逻辑关系词对应的节点所组成的节点组确定为该子规则文本串的规则标识信息与所述目标子规则文本串的规则标识信息的共用节点组;保存该子规则文本串的规则标识信息与所述第二要素及与所述第二逻辑关系词之间的对应关系;
若否,则将当前特征匹配规则树中,所述第二要素对应的节点确定为该子规则文本串的规则标识信息与所述目标子规则文本串的规则标识信息的共用节点;在当前特征匹配规则树中建立所述目标第一逻辑关系词对应的第二节点,并连接该第二节点与所述第二要素对应的节点,保存该子规则文本串的规则标识信息与所述第二要素及与所述目标第一逻辑关系词之间的对应关系。
在一种可能的实施方式中,所述第一确定模块,具体用于识别该子规则文本串中包含的预设的分隔符,基于所述分隔符,将该子规则文本串分割为多个词素;
针对每个词素,根据预先保存的词素与词素类型的对应关系,确定该词素对应的目标词素类型;基于所述目标词素类型,确定该词素为第一要素或者为与第一要素存在关联的第一逻辑关系词。
在一种可能的实施方式中,所述构建模块112,还用于基于上下文无关文法及递归下降算法,对该子规则文本串进行语法分析;若该子规则文本串的语法分析结果为合格,则进行后续所述针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同的步骤。
在一种可能的实施方式中,所述构建模块112,还用于将该第一要素作为该子规则文本串对应的子规则树中包含的第一子节点,将所述目标第一逻辑关系词作为所述子规则树中包含的第二子节点,将在所述子规则文本串中存在关联关系的第一子节点与第二子节点之间进行连接,建立该子规则文本串对应的子规则树;基于该子规则树,进行后续针对该子规则文本串对应的子规则树中包含的任一第一要素对应的第一子节点,判断该第一子节点的第一要素与当前特征匹配规则树中包含的任一节点的要素是否均不相同的步骤。
在一种可能的实施方式中,所述构建模块112,还用于基于预设的谓词推演算法及子节点排序规则,对该子规则树中包含的子节点及子节点的排序顺序进行整理。
实施例4:
基于相同的技术构思,本申请提供了一种特征匹配装置,图12示出了一些实施例提供的一种特征匹配装置示意图,如图12所示,所述装置包括:
第二确定模块121,用于接收账户特征数据,确定所述账户特征数据中包含的每个第三要素及与第三要素存在关联的第三逻辑关系词;
第三确定模块122,用于根据特征匹配规则树中包含的每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息;
第四确定模块123,用于将预设的所述目标规则标识信息对应的目标结果值确定为所述账户特征数据适用的结果值。
在一种可能的实施方式中,所述第三确定模块122,具体用于针对任一规则标识信息对应的每个节点,判断该节点是否为该规则标识信息与其他规则标识信息的共用节点或共用节点组中的节点;
若是,且如果当前保存有其他规则标识信息的该共用节点或共同节点组对所述账户特征数据的匹配信息,则直接将所述匹配信息,作为该节点或该节点所在的共用节点组对所述账户特征数据的匹配信息;如果当前未保存有其他规则标识信息的该共用节点或共同节点组对所述账户特征数据的匹配信息,则将该节点或该节点所在的共用节点组与所述账户特征数据中对应的第三要素和/或第三逻辑关系词进行匹配,确定该节点或该节点所在的共用节点组对所述账户特征数据的匹配信息,并保存;
若否,则将该节点与所述账户特征数据中对应的第三要素或第三逻辑关系词进行匹配,确定该节点对所述账户特征数据的匹配信息;
将规则标识信息对应的每个节点对所述账户特征数据的匹配信息均为匹配的规则标识信息,确定为所述目标规则标识信息。
在一种可能的实施方式中,所述第三确定模块122,具体用于根据为特征匹配规则树中包含的每个规则标识信息预设的优先级的先后顺序,依次根据每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息。
实施例5:
基于相同的技术构思,本申请还提供了一种电子设备,图13示出了一些实施例提供的一种电子设备结构示意图,如图13所示,包括:处理器131、通信接口132、存储器133和通信总线134,其中,处理器131,通信接口132,存储器133通过通信总线134完成相互间的通信;
所述存储器133中存储有计算机程序,当所述程序被所述处理器131执行时,使得所述处理器131执行如上述任一所述特征匹配规则构建方法的步骤,或,实现如上述任一所述特征匹配方法的步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口132用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
实施例6:
基于相同的技术构思,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行时实现如上述任一所述特征匹配规则构建方法的步骤,或,实现如上述任一所述特征匹配方法的步骤。
上述计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(MO)等、光学存储器如CD、DVD、BD、HVD等、以及半导体存储器如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD)等。
基于相同的技术构思,本申请提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行如上述任一所述特征匹配规则构建方法的步骤,或,实现如上述任一所述特征匹配方法的步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令,在计算机上加载和执行所述计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (14)

1.一种特征匹配规则构建方法,其特征在于,所述方法包括:
针对接收到的每个子规则文本串,确定该子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词;针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同;若是,则在当前特征匹配规则树中建立该第一要素对应的第一节点;识别该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词,在当前特征匹配规则树中建立该目标第一逻辑关系词对应的第二节点,并连接该第一节点和该第二节点,保存该子规则文本串的规则标识信息与该第一要素及与所述目标第一逻辑关系词之间的对应关系。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若该第一要素与当前特征匹配规则树中包含的目标子规则文本串的第二要素相同,判断当前特征匹配规则树中与所述第二要素连接的第二逻辑关系词是否与该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词相同;
若是,则将当前特征匹配规则树中,所述第二要素对应的节点及所述第二逻辑关系词对应的节点所组成的节点组确定为该子规则文本串的规则标识信息与所述目标子规则文本串的规则标识信息的共用节点组;保存该子规则文本串的规则标识信息与所述第二要素及与所述第二逻辑关系词之间的对应关系;
若否,则将当前特征匹配规则树中,所述第二要素对应的节点确定为该子规则文本串的规则标识信息与所述目标子规则文本串的规则标识信息的共用节点;在当前特征匹配规则树中建立所述目标第一逻辑关系词对应的第二节点,并连接该第二节点与所述第二要素对应的节点,保存该子规则文本串的规则标识信息与所述第二要素及与所述目标第一逻辑关系词之间的对应关系。
3.根据权利要求1所述的方法,其特征在于,所述确定该子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词包括:
识别该子规则文本串中包含的预设的分隔符,基于所述分隔符,将该子规则文本串分割为多个词素;
针对每个词素,根据预先保存的词素与词素类型的对应关系,确定该词素对应的目标词素类型;基于所述目标词素类型,确定该词素为第一要素或者为与第一要素存在关联的第一逻辑关系词。
4.根据权利要求1或3所述的方法,其特征在于,所述确定该子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词之后,所述针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同之前,所述方法还包括:
基于上下文无关文法及递归下降算法,对该子规则文本串进行语法分析;若该子规则文本串的语法分析结果为合格,则进行后续步骤。
5.根据权利要求4所述的方法,其特征在于,若该子规则文本串的语法分析结果为合格,所述针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同之前,所述方法还包括:
将该第一要素作为该子规则文本串对应的子规则树中包含的第一子节点,将所述目标第一逻辑关系词作为所述子规则树中包含的第二子节点,将在所述子规则文本串中存在关联关系的第一子节点与第二子节点之间进行连接,建立该子规则文本串对应的子规则树;基于该子规则树,进行后续针对该子规则文本串对应的子规则树中包含的任一第一要素对应的第一子节点,判断该第一子节点的第一要素与当前特征匹配规则树中包含的任一节点的要素是否均不相同的步骤。
6.根据权利要求5所述的方法,其特征在于,所述建立该子规则文本串对应的子规则树之后,所述基于该子规则树,进行后续针对该子规则文本串对应的子规则树中包含的任一第一要素对应的第一子节点,判断该第一子节点的第一要素与当前特征匹配规则树中包含的任一节点的要素是否均不相同的步骤之前,所述方法还包括:
基于预设的谓词推演算法及子节点排序规则,对该子规则树中包含的子节点及子节点的排序顺序进行整理。
7.根据权利要求1所述的方法,其特征在于,所述第一要素包括:单例要素或衍生要素。
8.一种特征匹配方法,其特征在于,所述方法包括:
接收账户特征数据,确定所述账户特征数据中包含的每个第三要素及与第三要素存在关联的第三逻辑关系词;
根据特征匹配规则树中包含的每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息;
将预设的所述目标规则标识信息对应的目标结果值确定为所述账户特征数据适用的结果值。
9.根据权利要求8所述的方法,其特征在于,所述根据特征匹配规则树中包含的每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息包括:
针对任一规则标识信息对应的每个节点,判断该节点是否为该规则标识信息与其他规则标识信息的共用节点或共用节点组中的节点;
若是,且如果当前保存有其他规则标识信息的该共用节点或共同节点组对所述账户特征数据的匹配信息,则直接将所述匹配信息,作为该节点或该节点所在的共用节点组对所述账户特征数据的匹配信息;如果当前未保存有其他规则标识信息的该共用节点或共同节点组对所述账户特征数据的匹配信息,则将该节点或该节点所在的共用节点组与所述账户特征数据中对应的第三要素和/或第三逻辑关系词进行匹配,确定该节点或该节点所在的共用节点组对所述账户特征数据的匹配信息,并保存;
若否,则将该节点与所述账户特征数据中对应的第三要素或第三逻辑关系词进行匹配,确定该节点对所述账户特征数据的匹配信息;
将规则标识信息对应的每个节点对所述账户特征数据的匹配信息均为匹配的规则标识信息,确定为所述目标规则标识信息。
10.根据权利要求8所述的方法,其特征在于,所述根据特征匹配规则树中包含的每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息包括:
根据为特征匹配规则树中包含的每个规则标识信息预设的优先级的先后顺序,依次根据每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息。
11.一种特征匹配规则构建装置,其特征在于,所述装置包括:
第一确定模块,用于针对接收到的每个子规则文本串,确定该子规则文本串中包含的每个第一要素及与第一要素存在关联的第一逻辑关系词;
构建模块,用于针对该子规则文本串中包含的任一第一要素,判断该第一要素与当前特征匹配规则树中包含的任一要素是否均不相同;若是,则在当前特征匹配规则树中建立该第一要素对应的第一节点;识别该子规则文本串中与该第一要素存在关联的目标第一逻辑关系词,在当前特征匹配规则树中建立该目标第一逻辑关系词对应的第二节点,并连接该第一节点和该第二节点,保存该子规则文本串的规则标识信息与该第一要素及与所述目标第一逻辑关系词之间的对应关系。
12.一种特征匹配装置,其特征在于,所述装置包括:
第二确定模块,用于接收账户特征数据,确定所述账户特征数据中包含的每个第三要素及与第三要素存在关联的第三逻辑关系词;
第三确定模块,用于根据特征匹配规则树中包含的每个规则标识信息与要素及逻辑关系词之间的对应关系,确定与所述每个第三要素及与第三要素存在关联的第三逻辑关系词匹配的目标规则标识信息;
第四确定模块,用于将预设的所述目标规则标识信息对应的目标结果值确定为所述账户特征数据适用的结果值。
13.一种电子设备,其特征在于,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7中任一所述特征匹配规则构建方法的步骤,或,实现如权利要求8-10任一所述特征匹配方法的步骤。
14.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述特征匹配规则构建方法的步骤,或,实现如权利要求8-10任一所述特征匹配方法的步骤。
CN202210130341.5A 2022-02-11 2022-02-11 特征匹配规则构建、特征匹配方法、装置、设备及介质 Pending CN114564624A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202210130341.5A CN114564624A (zh) 2022-02-11 2022-02-11 特征匹配规则构建、特征匹配方法、装置、设备及介质
PCT/CN2022/112610 WO2023151252A1 (zh) 2022-02-11 2022-08-15 特征匹配规则构建、特征匹配方法、装置、设备及介质
TW111133532A TWI844091B (zh) 2022-02-11 2022-09-05 特徵匹配規則構建、特徵匹配方法、裝置、設備及介質

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210130341.5A CN114564624A (zh) 2022-02-11 2022-02-11 特征匹配规则构建、特征匹配方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114564624A true CN114564624A (zh) 2022-05-31

Family

ID=81714518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210130341.5A Pending CN114564624A (zh) 2022-02-11 2022-02-11 特征匹配规则构建、特征匹配方法、装置、设备及介质

Country Status (2)

Country Link
CN (1) CN114564624A (zh)
WO (1) WO2023151252A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115358684A (zh) * 2022-10-21 2022-11-18 深圳美云集网络科技有限责任公司 基于最小存货单位sku的数据配对方法及相关装置
WO2023151252A1 (zh) * 2022-02-11 2023-08-17 中国银联股份有限公司 特征匹配规则构建、特征匹配方法、装置、设备及介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8856642B1 (en) * 2013-07-22 2014-10-07 Recommind, Inc. Information extraction and annotation systems and methods for documents
CN103973684B (zh) * 2014-05-07 2017-05-24 北京神州绿盟信息安全科技股份有限公司 规则编译匹配方法及装置
CN106648662B (zh) * 2016-12-23 2020-02-21 江西博微新技术有限公司 基于工程造价计算描述语言bcl的报表生成装置及生成方法
CN114564624A (zh) * 2022-02-11 2022-05-31 中国银联股份有限公司 特征匹配规则构建、特征匹配方法、装置、设备及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023151252A1 (zh) * 2022-02-11 2023-08-17 中国银联股份有限公司 特征匹配规则构建、特征匹配方法、装置、设备及介质
CN115358684A (zh) * 2022-10-21 2022-11-18 深圳美云集网络科技有限责任公司 基于最小存货单位sku的数据配对方法及相关装置
CN115358684B (zh) * 2022-10-21 2023-01-31 深圳美云集网络科技有限责任公司 基于最小存货单位sku的数据配对方法及相关装置

Also Published As

Publication number Publication date
WO2023151252A1 (zh) 2023-08-17
TW202333069A (zh) 2023-08-16

Similar Documents

Publication Publication Date Title
US10133650B1 (en) Automated API parameter resolution and validation
CN107644323B (zh) 一种面向业务流的智能审核系统
CN109343857B (zh) 线上部署机器学习模型的方法、设备和存储介质
US9390176B2 (en) System and method for recursively traversing the internet and other sources to identify, gather, curate, adjudicate, and qualify business identity and related data
CN114564624A (zh) 特征匹配规则构建、特征匹配方法、装置、设备及介质
US9104709B2 (en) Cleansing a database system to improve data quality
CN108228166A (zh) 一种基于模板的后端代码生成方法及系统
CN110502227B (zh) 代码补全的方法及装置、存储介质、电子设备
CN109144879B (zh) 测试分析方法及装置
CN114048129A (zh) 软件功能变更的自动化测试方法、装置、设备及系统
CN116415206A (zh) 运营商多数据融合方法、系统、电子设备及计算机存储介质
CN112181430A (zh) 代码变更统计方法、装置、电子设备及存储介质
CN111126965B (zh) 审核规则优化方法、装置、计算机设备以及存储介质
CN117291722A (zh) 对象管理方法、相关设备及计算机可读介质
CN116127154A (zh) 知识标签推荐方法、装置、电子设备及存储介质
CN111581950B (zh) 同义名称词的确定方法和同义名称词的知识库的建立方法
CN114372083A (zh) 元数据分析方法及装置
CN111352818B (zh) 应用程序性能分析方法、装置、存储介质及电子设备
CN114443803A (zh) 一种文本信息挖掘方法、装置、电子设备和存储介质
KR20020027088A (ko) 구문 분석에 의거한 자연어 처리 기술 및 그 응용
CN115378824B (zh) 模型相似度确定方法、装置、设备及存储介质
CN117688564B (zh) 一种用于智能合约事件日志的检测方法、装置和存储介质
CN113408597B (zh) 一种基于两阶段框架的Java方法名推荐方法
CN115562645B (zh) 一种基于程序语义的配置故障预测方法
CN111427870B (zh) 一种资源管理方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40068748

Country of ref document: HK