CN115687599A - 业务数据处理方法、装置、电子设备及存储介质 - Google Patents
业务数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115687599A CN115687599A CN202211203754.8A CN202211203754A CN115687599A CN 115687599 A CN115687599 A CN 115687599A CN 202211203754 A CN202211203754 A CN 202211203754A CN 115687599 A CN115687599 A CN 115687599A
- Authority
- CN
- China
- Prior art keywords
- event
- target
- events
- sequence
- subset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 238000000034 method Methods 0.000 claims abstract description 53
- 238000012163 sequencing technique Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims description 43
- 238000000605 extraction Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 40
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000012502 risk assessment Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 101150053844 APP1 gene Proteins 0.000 description 1
- 101100055496 Arabidopsis thaliana APP2 gene Proteins 0.000 description 1
- 101100189105 Homo sapiens PABPC4 gene Proteins 0.000 description 1
- 102100039424 Polyadenylate-binding protein 4 Human genes 0.000 description 1
- 101100016250 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GYL1 gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000021393 food security Nutrition 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种业务数据处理方法、装置、电子设备及存储介质,涉及计算机技术领域。本方法通过从目标对象的业务操作数据中进行事件抽取可得到目标对象所执行的多个事件,按照预设的维度和预设的逻辑顺序对多个事件进行分组排序后可得到针对目标对象的目标事件集;而基于目标事件集中各事件的序号对目标事件集进行事件子集的分割,由于各事件的序号是根据目标风险模型中事件类型序列中各事件类型的序号确定的,这样可最大程度上从目标事件集中分割出与目标风险模型中的事件类型序列匹配的事件子集,从而根据事件子集与目标风险模型的匹配结果,确定目标事件集的风险信息,可以极大提升事件集风险信息的判定准确性。
Description
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种业务数据处理方法、装置、电子设备及存储介质。
背景技术
目前,在对数据进行分析时,可以将数据抽取为事件,通过对事件的风险信息进行判断,以用于风险分析、预测等场景中。
现有技术中,通常采用构建的风险模型对事件的风险信息进行计算,然而,当前的风险模型比较单一,基本是由“与”“或”逻辑事件序列构成,仅能对按照“与”“或”逻辑执行的事件进行判断。因此可能导致对事件的处理分析不够全面,评判结果准确性较差。
发明内容
本申请的目的在于,针对上述现有技术中的不足,提供一种业务数据处理方法、装置、电子设备及存储介质,以便于解决现有技术中存在的事件分析处理准确性差的问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供了一种业务数据处理方法,包括:
对目标对象的业务操作数据进行事件抽取,得到多个事件;
按照预设的维度以及预设的逻辑顺序对所述多个事件进行分组排序处理,得到至少一个目标事件集;
根据所述目标事件集中各事件的序号,生成所述目标事件集对应的至少一个事件子集,其中,所述事件的序号用于表征所述事件所属的事件类型在目标风险模型中的排序,所述目标风险模型包括目标业务场景下存在风险的至少一个事件类型序列;
根据所述目标事件集对应的各事件子集与所述目标风险模型的匹配结果,确定所述目标事件集的风险信息。
可选地,所述根据所述目标事件集中各事件的序号,生成所述目标事件集对应的至少一个事件子集,包括:
根据所述目标事件集中各事件的序号,对所述目标事件集中各事件进行栈运算,并基于栈运算的结果得到所述至少一个事件子集。
可选地,根据所述目标事件集中各事件的序号,对所述目标事件集中各事件进行栈运算,并基于栈运算的结果得到所述至少一个事件子集,包括:
遍历所述目标事件集中的各事件,将排序第一的事件作为初始的栈顶元素进行入栈,得到初始的栈队;
由排序第二的事件为起始,依次获取各事件,并将各事件分别与当前的栈顶元素进行比对,根据比对结果,更新当前的栈顶元素以及构建新的栈队;
当所述目标事件集中各事件遍历完成,分别将构建的各栈队中的事件组合为一个事件子集。
可选地,所述将各事件分别与当前的栈顶元素进行比对,根据比对结果,更新当前的栈顶元素以及构建新的栈队,包括:
若当前获取的事件的事件序号与当前的栈顶元素的事件序号相同,则将当前获取的事件丢弃;
若当前获取的事件的事件序号所表征的排序在当前的栈顶元素的事件序号所表征的排序之后,则将当前获取的事件作为新的栈顶元素加入所述初始的栈队;
若当前获取的事件的事件序号所表征的排序在当前的栈顶元素的事件序号所表征的排序之前,则将所述初始的栈队确定为所述目标事件集对应的一个事件子集,将栈队的元素出栈,并将所述当前获取的事件作为当前新的栈顶元素入栈,构建新的栈队,重复执行,直至遍历完所述目标事件集中的所有事件。
可选地,所述对目标对象的业务操作数据进行事件抽取,得到多个事件,包括:
根据所述目标风险模型中的各事件类型,确定各事件类型对应的行为特征集合;
采用所述各事件类型对应的行为特征集合对所述业务操作数据进行事件抽取,得到多个事件。
可选地,所述采用所述各事件类型对应的行为特征集合对所述业务操作数据进行事件抽取,得到多个事件,包括:
根据各事件类型对应的行为特征集合中的各行为属性信息,从所述业务操作数据中抽取与各行为属性信息匹配的数据;
根据抽取的与各行为属性信息匹配的数据,生成多个事件。
可选地,所述按照预设的维度以及预设的逻辑顺序对所述多个事件进行分组排序处理,得到至少一个目标事件集,包括:
按照所述预设的维度对所述多个事件进行分组,得到至少一个初始事件集;
按照所述预设的逻辑顺序分别对各所述初始事件集中的事件进行排序,得到所述至少一个目标事件集。
可选地,所述预设的维度包括:用户标识,所述预设的逻辑顺序包括:时间顺序和事件序号顺序;
所述按照所述预设的维度对所述多个事件进行分组,得到至少一个初始事件集,包括:
根据各事件的用户标识,将用户标识相同的各事件划分至同一初始事件集;
所述按照所述预设的逻辑顺序分别对各所述初始事件集中的事件进行排序,得到所述至少一个目标事件集,包括:
根据各初始事件集中各事件的发生时间,按照发生时间先后顺序依次将各事件进行排序,其中,对于发生时间相同的各事件,按照所述事件序号顺序依次排序,得到所述至少一个事件集。
可选地,所述根据所述目标事件集对应的各事件子集与所述目标风险模型的匹配结果,确定所述目标事件集的风险信息,包括:
将目标事件集对应的各事件子集分别与所述目标风险模型进行匹配;
若目标事件集对应的各事件子集中至少一个事件子集与所述目标风险模型匹配成功,则确定所述目标事件集属于风险事件集。
若目标事件集对应的各事件子集与所述目标风险模型均未匹配成功,则确定所述目标事件集属于正常事件集。
可选地,所述若目标事件集对应的各事件子集中至少一个事件子集与所述目标风险模型匹配成功,则确定所述目标事件集属于风险事件集,包括:
将所述目标事件集对应的各事件子集分别与所述目标风险模型进行匹配,若目标事件子集中依次排列的各事件分别与所述目标风险模型中包含的事件类型序列中各事件类型依次匹配成功,则确定所述目标事件子集属于风险事件子集;
将目标事件子集所属的目标事件集确定为风险事件集。
可选地,所述若目标事件子集中依次排列的各事件分别与所述目标风险模型中包含的事件类型序列中各事件类型依次匹配成功,则确定所述目标事件子集属于风险事件子集,包括:
若所述目标事件子集中依次排列的各事件的类型分别与所述目标风险模型中对应排列的事件类型相同,则确定所述目标事件子集属于风险事件子集。
第二方面,本申请实施例还提供了一种业务数据处理装置,包括:获取模块、处理模块、生成模块、匹配模块;
所述获取模块,用于对目标对象的业务操作数据进行事件抽取,得到多个事件;
所述处理模块,用于按照预设的维度以及预设的逻辑顺序对所述多个事件进行分组排序处理,得到至少一个目标事件集;
所述生成模块,用于根据所述目标事件集中各事件的序号,生成所述目标事件集对应的至少一个事件子集,其中,所述事件的序号用于表征所述事件所属的事件类型在目标风险模型中的排序,所述目标风险模型包括目标业务场景下存在风险的至少一个事件类型序列;
所述匹配模块,用于根据所述目标事件集对应的各事件子集与所述目标风险模型的匹配结果,确定所述目标事件集的风险信息。
可选地,所述生成模块,具体用于根据所述目标事件集中各事件的序号,对所述目标事件集中各事件进行栈运算,并基于栈运算的结果得到所述至少一个事件子集。
可选地,所述生成模块,具体用于遍历所述目标事件集中的各事件,将排序第一的事件作为初始的栈顶元素进行入栈,得到初始的栈队;
由排序第二的事件为起始,依次获取各事件,并将各事件分别与当前的栈顶元素进行比对,根据比对结果,更新当前的栈顶元素以及构建新的栈队;
当所述目标事件集中各事件遍历完成,分别将构建的各栈队中的事件组合为一个事件子集。
可选地,所述生成模块,具体用于若当前获取的事件的事件序号与当前的栈顶元素的事件序号相同,则将当前获取的事件丢弃;
若当前获取的事件的事件序号所表征的排序在当前的栈顶元素的事件序号所表征的排序之后,则将当前获取的事件作为新的栈顶元素加入所述初始的栈队;
若当前获取的事件的事件序号所表征的排序在当前的栈顶元素的事件序号所表征的排序之前,则将所述初始的栈队确定为所述目标事件集对应的一个事件子集,将栈队的元素出栈,并将所述当前获取的事件作为当前新的栈顶元素入栈,构建新的栈队,重复执行,直至遍历完所述目标事件集中的所有事件。
可选地,所述获取模块,具体用于根据所述目标风险模型中的各事件类型,确定各事件类型对应的行为特征集合;
采用所述各事件类型对应的行为特征集合对所述业务操作数据进行事件抽取,得到多个事件。
可选地,所述获取模块,具体用于根据各事件类型对应的行为特征集合中的各行为属性信息,从所述业务操作数据中抽取与各行为属性信息匹配的数据;
根据抽取的与各行为属性信息匹配的数据,生成多个事件。
可选地,所述处理模块,具体用于按照所述预设的维度对所述多个事件进行分组,得到至少一个初始事件集;
按照所述预设的逻辑顺序分别对各所述初始事件集中的事件进行排序,得到所述至少一个目标事件集。
可选地,所述预设的维度包括:用户标识,所述预设的逻辑顺序包括:时间顺序和事件序号顺序;
可选地,所述处理模块,具体用于根据各事件的用户标识,将用户标识相同的各事件划分至同一初始事件集;
可选地,所述处理模块,具体用于根据各初始事件集中各事件的发生时间,按照发生时间先后顺序依次将各事件进行排序,其中,对于发生时间相同的各事件,按照所述事件序号顺序依次排序,得到所述至少一个事件集。
可选地,所述匹配模块,具体用于将目标事件集对应的各事件子集分别与所述目标风险模型进行匹配;
若目标事件集对应的各事件子集中至少一个事件子集与所述目标风险模型匹配成功,则确定所述目标事件集属于风险事件集;
若目标事件集对应的各事件子集与所述目标风险模型均未匹配成功,则确定所述目标事件集属于正常事件集。
可选地,所述匹配模块,具体用于将所述目标事件集对应的各事件子集分别与所述目标风险模型进行匹配,若目标事件子集中依次排列的各事件分别与所述目标风险模型中包含的事件类型序列中各事件类型依次匹配成功,则确定所述目标事件子集属于风险事件子集;
将目标事件子集所属的目标事件集确定为风险事件集。
可选地,所述匹配模块,具体用于若所述目标事件子集中依次排列的各事件的类型分别与所述目标风险模型中对应排列的事件类型相同,则确定所述目标事件子集属于风险事件子集。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行时执行如第一方面中提供的方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如第一方面提供的电子设备方法的步骤。
本申请的有益效果是:
本申请提供一种业务数据处理方法、装置、电子设备及存储介质,通过从目标对象的业务操作数据中进行事件抽取可得到目标对象所执行的多个事件,按照预设的维度和预设的逻辑顺序对多个事件进行分组排序后可得到针对目标对象的目标事件集;而基于目标事件集中各事件的序号对目标事件集进行事件子集的分割,由于各事件的序号是根据目标风险模型中事件类型序列中各事件类型的序号确定的,这样可最大程度上从目标事件集中分割出与目标风险模型中的事件类型序列匹配的事件子集,从而根据事件子集与目标风险模型的匹配结果,确定目标事件集的风险信息。其中,通过事件抽取以及生成事件子集,可精确的从目标对象的业务操作数据中捕捉到满足风险模型的事件序列,从而提升事件集风险信息的判定准确性。
其次,本实施例根据事件的序号,采用栈运算对分组排序后的目标事件集进行循环切割,得到目标事件集对应的事件子集,所有目标事件集中所有的事件最多仅需入栈一次,不存在反复压栈情况,运算效率高。且栈运算可有效控制栈内包含的事件的数量,使得能够精确的切割得到与目标风险模型匹配的事件子集,极大的提高了模型匹配的精准性。
另外,本实施例中当风险场景下的风险模型数量为多个时,对于事件的抽取分组排序得到事件子集的运算方式依然适用,无论是单个风险模型还是一组风险模型,均可共用一套预设维度、预设逻辑顺序和栈运算方式,仅需在风险模型匹配时增加匹配量而已。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的业务数据处理方法的流程示意图一;
图2为本申请实施例提供的业务数据处理方法的流程示意图二;
图3为本申请实施例提供的业务数据处理方法的流程示意图三;
图4为本申请实施例提供的业务数据处理方法的流程示意图四;
图5为本申请实施例提供的业务数据处理方法的流程示意图五;
图6为本申请实施例提供的业务数据处理方法的流程示意图六;
图7为本申请实施例提供的业务数据处理方法的流程示意图七;
图8为本申请实施例提供的一种业务操作数据处理示意图;
图9为本申请实施例提供的一种业务操作数据处理装置的示意图;
图10为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
首先对本申请所涉及的应用场景进行简单说明,本申请方案可应用于多个领域,例如金融领域、食品安全领域、线上交易领域等等。本方法用于对目标对象在业务场景下所产生的业务数据进行分析,以指导业务的运维管理。
风险模型可以定义为:对现实风险场景的抽象,通常由多个单独的具体的事件按一定逻辑关系组合而成。例如从业务数据中抽取出了事件1、事件2和事件3,各事件的发生情况为:发生了事件1,并且发生了事件2或者事件3。将该风险场景抽象为风险模型(事件1&(事件2|事件3)),对于符合该风险模型的事件集,可认为属于风险事件集。
上述所列举的风险模型是目前常用的“与”“或”逻辑的风险模型,其可对由“与”“或”逻辑事件构成的事件集的风险信息进行判定,然而,实际场景中,也不乏会存在很多顺序逻辑事件,由此,本申请提供了基于构建的顺序有向逻辑的风险模型,对具有顺序逻辑的事件集进行风险信息的判断,以弥补现有的风险模型无法对顺序有向逻辑的事件集进行风险信息判定的不足,从而提高了风险信息计算的全面性和精确性。
其中,本申请还提供了特定的事件计算方式,仅需根据所获取的目标对象的业务操作数据进行事件抽取和事件分组排序、以及栈运算,即可高效准确的从目标对象的业务操作数据中抽取出符合所构建的顺序有向逻辑风险模型的事件子集,从而基于抽取出的事件子集匹配风险模型,得到事件子集的风险信息,进而得到事件子集所属的事件集的风险信息。
本申请所提供的特定的事件计算方式(事件抽取和事件分组排序、以及栈运算)作为风险模型匹配的前端操作,具有较高的通用性,可适用于任意风险场景所对应的顺序有向逻辑风险模型,在应用于不同的风险场景下时,仅仅是所构建的顺序有向逻辑风险模型中包含的具体事件及其排列顺序有所区别。
如下将通过具体的实施例对本申请的方法进行介绍。
图1为本申请实施例提供的业务数据处理方法的流程示意图一;本方法的执行主体可以是计算机设备,如图1所示,该方法可包括:
S101、对目标对象的业务操作数据进行事件抽取,得到多个事件。
可选地,本方法可应用于风控系统中,风控系统可从前端的业务系统中获取目标对象的业务操作数据,其中,这里的目标对象可以包括但不限于:个人、企业。例如:可以是贷前环节进行信用风险评估的企业、可以是进行股票操盘的企业、也可以是进行转账交易的个人等。
可选地,对目标对象进行业务操作数据的获取可以是仅获取某个特定目标对象的业务操作数据,也可以是同时获取大批目标对象的业务操作数据。
在一些实施例中,可对所获取的目标对象的业务操作数据进行事件抽取,也即将业务操作数据中抽取出事件数据,而事件数据可组合为不同的事件,得到多个事件。
S102、按照预设的维度以及预设的逻辑顺序对多个事件进行分组排序处理,得到至少一个目标事件集。
可选地,预设的维度和预设的逻辑顺序与风险场景相关,对风险场景的定义包括:构建风险模型、设定运算维度和逻辑顺序(例如时间方向)、事件序号等。本实施例中,风险模型的表达式可以为(如:A->B->C),对应的事件序号可以是根据风险模型的表达式自动赋值,如A-1、B-2、C-3。
在风险场景确定的情况下,可确定预设的维度以及预设的逻辑顺序,从而根据预设的维度以及预设的逻辑顺序对上述得到的多个事件进行分组排序处理,得到至少一个目标事件集。
S103、根据目标事件集中各事件的序号,生成目标事件集对应的至少一个事件子集,其中,事件的序号用于表征事件所属的事件类型在目标风险模型中的排序,目标风险模型包括目标业务场景下存在风险的至少一个事件类型序列。
得到的目标事件集中可包括多个事件,每个事件有对应的事件序号,而事件的序号表征事件所属的事件类型在目标风险模型中的排序,而目标风险模型包括目标业务场景下存在风险的至少一个事件类型序列。如上述所说的,假设目标风险模型为:A->B->C,也即,从时间顺序上来说,当先发生事件类型为A的事件,再发生事件类型为B的事件,再发生事件类型为C的事件时,则认为事件集可能属于风险事件集。对应的,按照事件类型序列,可依次为风险模型中各事件类型依次赋予序号,例如:A事件类型对应序号1,B事件类型对应序号2,C事件类型对应序号3。
基于风险模型中各事件类型的序号,则可确定目标事件集中各事件的序号。通常,在从业务操作数据中抽取出事件后,可判断各事件属于哪个事件类型,从而根据事件所属的事件类型确定事件的序号。
在一种可实现的方式中,本方法根据目标事件集中各事件的序号,对目标事件集进行分割,得到目标事件集对应的至少一个事件子集,其中,目标事件集和事件子集均可称为事件序列,目标事件集和事件子集中包含的各事件均是按照顺序排列的,均属于有序集合。
可选地,基于事件的序号对目标事件集进行分割,使得能够精确的从多个事件中分割出与风险模型中的事件类型序列匹配的,按照事件类型序列的发生顺序依次排列的事件序列,也即,能够尽可能的从目标事件集的多个事件中将满足风险模型(A->B->C)的事件子集分割出来,从而事件子集可用于对目标事件集的风险信息的精确评判。
S104、根据目标事件集对应的各事件子集与目标风险模型的匹配结果,确定目标事件集的风险信息。
可选地,可将生成的目标事件集对应的每个事件子集分别与目标风险模型进行匹配处理,这样,每个事件子集均可得到一个匹配结果,结合每个事件子集的匹配结果,可确定目标事件集的风险信息。
而得到的目标事件集的风险信息可用于风险分析、预测等场景,例如:进行业务改进以提升业务量、进行客户业务操作的评估以减少客户的损失,或者进行企业管理制度的改进等。
综上,本实施例提供的业务数据处理方法,通过从目标对象的业务操作数据中进行事件抽取可得到目标对象所执行的多个事件,按照预设的维度和预设的逻辑顺序对多个事件进行分组排序后可得到针对目标对象的目标事件集;而基于目标事件集中各事件的序号对目标事件集进行事件子集的分割,由于各事件的序号是根据目标风险模型中事件类型序列中各事件类型的序号确定的,这样可最大程度上从目标事件集中分割出与目标风险模型中的事件类型序列匹配的事件子集,从而根据事件子集与目标风险模型的匹配结果,确定目标事件集的风险信息。其中,通过事件抽取以及生成事件子集,可精确的从目标对象的业务操作数据中捕捉到满足风险模型的事件序列,从而提升事件集风险信息的判定准确性。
可选地,步骤S103中,根据目标事件集中各事件的序号,生成目标事件集对应的至少一个事件子集,可以包括:根据目标事件集中各事件的序号,对目标事件集中各事件进行栈运算,并基于栈运算的结果得到至少一个事件子集。
本实施例中采用栈运算方式,根据目标事件集中各事件的序号,对目标事件集进行循环切割,得到目标事件集对应的至少一个事件子集。
基于栈运算方式可使得目标事件集中各事件均只被计算一次,避免重复计算带来的运算量大的问题,从而提高风险评估效率。
图2为本申请实施例提供的业务数据处理方法的流程示意图二;可选地,上述步骤中,根据目标事件集中各事件的序号,对目标事件集中各事件进行栈运算,并基于栈运算的结果得到至少一个事件子集,可以包括:
S201、遍历目标事件集中的各事件,将排序第一的事件作为初始的栈顶元素进行入栈,得到初始的栈队。
可选地,可从目标事件集中排序第一的事件进行遍历,当获取到排序第一的事件后,可将其作为初始的栈顶元素进行入栈,得到初始的栈队。
S202、由排序第二的事件为起始,依次获取各事件,并将各事件分别与当前的栈顶元素进行比对,根据比对结果,更新当前的栈顶元素以及构建新的栈队。
而从排序第二的事件为起始,每获取到当前的事件后,均将当前事件的序号与初始的栈队的当前栈顶元素的序号进行比对,根据比对结果确定对当前事件的处理方式,其中包括两种处理方式:一种是将当前事件归入初始的栈队,此时,当前事件将作为初始的栈队当前的栈顶元素;另一种是将当前事件作为新的栈顶元素进行入栈,得到新的栈队,此时,初始的栈队中的各事件将组合得到一个事件子集。
可以理解为当前事件作为新的栈顶元素进行入栈,得到新的栈队后,可将初始栈队中的所有元素全部出栈生成一个事件子集,也即,当有新的栈队创建时,当前旧的栈队中的所有元素出栈作为一个事件子集。
S203、当目标事件集中各事件遍历完成,分别将构建的各栈队中的事件组合为一个事件子集。
可选地,基于上述方式,针对当前获取的每个事件,均执行相同的处理,直至遍历完成目标事件集中所有的事件,得到多个栈队,并分别将各栈队中的事件组合为目标事件集的一个事件子集。
可选地,步骤S202中,将各事件分别与当前的栈顶元素进行比对,根据比对结果,更新当前的栈顶元素以及构建新的栈队,可以包括:
若当前获取的事件的事件序号与当前的栈顶元素的事件序号相同,则将当前获取的事件丢弃。
在前面的实施例中以说明,事件的序号表征的是事件所属的事件类型在目标风险模型中的序号,当两个事件的序号相同时,也即两个事件所属的事件类型是相同的,仅保留一个事件即可。例如:风险模型包括:A->B->C,事件类型A对应的事件可能包括很多,当目标对象执行的事件1和事件2均属于事件类型A时,仅发生事件1或者仅发生事件2,均可匹配至目标风险模型中的事件类型A,故仅保留事件1或事件2的其中一个即可。而由于与当前获取的事件序号相同的事件已优先入栈,则可将当前获取的事件舍弃。
若当前获取的事件的事件序号所表征的排序在当前的栈顶元素的事件序号所表征的排序之后,则将当前获取的事件作为新的栈顶元素加入初始的栈队。
若当前获取的事件的事件序号所表征的排序在当前的栈顶元素的事件序号所表征的排序之前,则将初始的栈队确定为目标事件集对应的一个事件子集,将栈队的元素出栈,并将当前获取的事件作为当前新的栈顶元素入栈,构建新的栈队,重复执行,直至遍历完目标事件集中的所有事件。
通常,各事件按照事件序号进行排序时,既可以是从大到小排序也可以从小到大排序,而本方法基于序号进行事件入栈的目的是能够使得当前获取的事件的事件序号排序在当前的栈顶元素的事件序号之后的事件能够入栈,这样,基于栈的特性,新入栈的事件将位于栈顶,而前一个入栈的事件将位于栈队的第二,依次类推。
同时,基于序号进行事件入栈的目的还包括能够使得当前获取的事件的事件序号排序在当前的栈顶元素的事件序号之前的事件能够进入新的栈队,作为新的栈队的栈顶元素。也即,保证事件序号排序在当前的栈顶元素的事件序号之前的事件不进入当前的栈队,不与位于其之前的其他已被遍历结束的事件归入同一栈队,这样,可以使得构建的栈底的事件的类型属于事件类型A,位于栈顶的事件的类型属于事件类型C,且保证栈队中包含的事件的数量不会超过目标风险模型所包含的事件类型的数量。
基于栈的特性,数据单向出入,在栈中的事件出栈时,则会按照事件入栈的顺序,先进栈的元素先出栈,从而依次将栈内事件出栈。
由此,在将各栈队中的事件出栈组合得到事件子集时,得到的每个事件子集中各事件组成的事件序列将是按照目标风险模型中的事件类型的序列排序的,从而得到的事件子集可用于与目标风险模型进行匹配。
本实施例中采用栈运算对分组排序后的目标事件集进行循环切割,得到目标事件集对应的事件子集,所有目标事件集中所有的事件最多仅需入栈一次,不存在反复压栈情况,运算效率高。
另外,栈运算可有效控制栈内包含的事件的数量,使得能够精确的切割得到与目标风险模型匹配的事件子集,极大的提高了模型匹配的精准性。
在一种可实现的方式中,上述在对目标事件集进行切割得到事件子集的过程中,每创建一个新的栈队,则可将之前一个栈队组合成事件子集进行输出,并执行该事件子集与目标风险模型的匹配。也即,在本方案中,模型匹配与生成事件子集可同步执行,从而可有效缩短风险信息计算的耗时,提高计算效率。
图3为本申请实施例提供的业务数据处理方法的流程示意图三;可选地,步骤S101中,对目标对象的业务操作数据进行事件抽取,得到多个事件,可以包括:
S301、根据目标风险模型中的各事件类型,确定各事件类型对应的行为特征集合。
通常事件是由人物、地点、时间、事情组成的,本实施例中在进行事件抽取时,由于抽取的目的是能够抽取出符合目标风险模型中各事件类型的事件,那么,可先根据各事件类型,得到各事件类型对应的行为特征集合,这里的行为特征集合可以理解为特征属性。
例如事件类型为转账,那么事件类型对应的行为特征集合可包括:执行转账操作、执行转账操作的目标对象标识、执行转账操作的时间、执行转账操作的地点等。
S302、采用各事件类型对应的行为特征集合对业务操作数据进行事件抽取,得到多个事件。
由于事件是由一些行为特征组合得到的,而本实施例中需要抽取的是与目标风险模型中所设定的各事件类型对应的事件,故可基于确定的各事件类型对应的行为特征集合进行事件抽取。
可选地,可基于各事件类型对应的行为特征集合从业务操作数据中抽取出满足行为特征集合的数据,而由抽取到的数据可分别组成不同的事件,由于不同的事件类型对应有不同的行为特征集合,故组合得到的事件也可以包含不同的类型,以目标风险模型为A->B->C为例,那么抽取到的事件可以包括A类事件、B类事件或C类事件。
图4为本申请实施例提供的业务数据处理方法的流程示意图四;可选地,步骤S302中,采用各事件类型对应的行为特征集合对业务操作数据进行事件抽取,得到多个事件,可以包括:
S401、根据各事件类型对应的行为特征集合中的各行为属性信息,从业务操作数据中抽取与各行为属性信息匹配的数据。
这里的行为属性信息可以包括能够构成事件的时间信息、地点信息、人物信息、动作信息等,也即行为属性信息可以是一些关键词,基于行为属性信息,可以从业务操作数据中进行关键词匹配,从而抽取出与各事件类型对应的行为特征集合中的各行为属性信息匹配的各项数据。
S402、根据抽取的与各行为属性信息匹配的数据,生成多个事件。
可选地,针对每种事件类型,可将抽取到的能够组成该类事件的一组数据进行组合,例如:针对事件类型A,抽取到的数据包括:事件:向xx转账;目标对象标识:目标对象1,发生时间:x年x月x日x点x分;发生地点:1号营业部;那么,这些数据将组成一个事件,且由于组成的事件属于事件类型A,而事件类型A的序号为1,故可为该事件分配事件序号:1。
基于上述处理后,可最终组合得到多个事件,其中可包括属于目标风险模型中任一种事件类型的事件。
图5为本申请实施例提供的业务数据处理方法的流程示意图五;可选地,步骤S102中,按照预设的维度以及预设的逻辑顺序对多个事件进行分组排序处理,得到至少一个目标事件集,可以包括:
S501、按照预设的维度对多个事件进行分组,得到至少一个初始事件集。
预设的维度可以根据风险场景确定,当需要对某个目标对象的业务操作风险进行评估时,预设的维度可以是目标对象维度,那么得到的初始事件集可以是目标对象对应的事件集;当需要对某个企业的业务操作风险进行评估时,预设的维度可以是企业维度,那么得到的初始事件集可以是目标企业对应的事件集。也即,按照预设的维度进行分组后得到的初始事件集为目标对象对应的事件集,而目标对象是根据预设的维度确定的,目标对象可以是目标对象或者企业或者是其他任意对象,维度不同,所对应的目标对象是不同的。
由于获取的目标对象的业务操作数据可以包含多个目标对象的数据,那么抽取到的事件则会包括不同目标对象的发生的事件,而假设目标风险场景用于对某个目标对象的业务操作风险进行评估,那么,可以目标对象维度对抽取到的多个事件进行分组,将同一目标对象所发生的事件划分在一个组中,得到目标对象对应的初始事件集。
上述是以多个目标对象的维度来讲的,对多个事件分组后,会得到至少一个初始事件集,一个目标对象对应一个初始事件集。
S502、按照预设的逻辑顺序分别对各初始事件集中的事件进行排序,得到至少一个目标事件集。
由于本方案所构建的风险模型是顺序有向模型,风险模型是由顺序排列的事件类型构成,旨在对顺序有向发生事件所造成的风险进行评估,故本实施例中预设的逻辑顺序可以是时间顺序,可以按照各事件的发生时间对各初始事件集中的事件进行排序,得到至少一个目标事件集。其中,一个初始事件集对应一个目标事件集,目标事件集是对初始事件集中的各事件进行排序后得到的。
可选地,预设的维度可包括:用户标识,预设的逻辑顺序可包括:时间顺序和事件序号顺序。
本实施例中预设的维度和预设的逻辑顺序仅为一种示例,针对不同的风险场景,均可设置不同的维度以及不同的逻辑顺序以进行事件的分组排序处理。
步骤S501中,按照预设的维度对多个事件进行分组,得到至少一个初始事件集,可以包括:根据各事件的用户标识,将用户标识相同的各事件划分至同一初始事件集。
当预设的维度为用户标识时,则可根据各事件的用户标识,将用户标识相同的事件划分至同一初始事件集,这样可得到每个用户所对应的初始事件集,初始事件集中各事件均是该用户在进行业务操作时所发生的事件。
步骤S502中,按照预设的逻辑顺序分别对各初始事件集中的事件进行排序,得到至少一个目标事件集,可以包括:根据各初始事件集中各事件的发生时间,按照发生时间先后顺序依次将各事件进行排序,其中,对于发生时间相同的各事件,按照事件序号顺序依次排序,得到至少一个事件集。
可选地,针对初始事件集,可根据初始事件集中各事件的发生时间,按照发生时间先后顺序,依次对各事件进行排序,而针对发生时间相同的两个事件,则可按照各事件的序号进行排序,本实施例中由于风险模型中事件类型序列中各事件类型的序号是依次增大的,那么,在按照各事件的序号进行排序时,可将序号小的事件排列在序号大的事件前面,以使得排序后得到的目标事件集中各事件的排序能够满足更精准的事件子集切割。
图6为本申请实施例提供的业务数据处理方法的流程示意图六;可选地,步骤S104中,根据目标事件集对应的各事件子集与目标风险模型的匹配结果,确定目标事件集的风险信息,可以包括:
S601、将目标事件集对应的各事件子集分别与目标风险模型进行匹配。
可选地,针对每个目标事件集,需要将目标事件集所对应的每个事件子集均与目标风险模型进行匹配,以确保不遗漏目标事件集中的任一事件。
S602、若目标事件集对应的各事件子集中至少一个事件子集与目标风险模型匹配成功,则确定目标事件集属于风险事件集。
在一种可实现的方式中,目标事件集对应的所有事件子集中只要有一个事件子集与目标风险模型匹配成功,则可将目标事件集确定为风险事件集。
S603、若目标事件集对应的各事件子集与目标风险模型均未匹配成功,则确定目标事件集属于正常事件集。
而当目标事件集对应的所有事件子集与目标风险模型匹配均失败时,则可将目标事件集为正常事件集。
可以理解为目标对象在执行业务操作时依次发生了10个事件,而只要10个事件中任一连续发生的3个事件与目标风险模型匹配成功,那么无论在这3个事件之前或者之后发生了怎样的事件,均可认为目标事件集属于风险事件集。
图7为本申请实施例提供的业务数据处理方法的流程示意图七;可选地,步骤S602中,若目标事件集对应的各事件子集中至少一个事件子集与目标风险模型匹配成功,则确定目标事件集属于风险事件集,可以包括:
S701、将目标事件集对应的各事件子集分别与目标风险模型进行匹配,若目标事件子集中依次排列的各事件分别与目标风险模型中包含的事件类型序列中各事件类型依次匹配成功,则确定目标事件子集属于风险事件子集。
可选地,在将事件子集与目标风险模型进行匹配时,可以是将目标事件子集中按顺序排列的各事件依次与目标风险模型中按顺序排列的各事件类型进行匹配,例如:将目标事件子集中排序第一的事件与目标风险模型中排序第一的事件类型进行匹配;将目标事件子集中排序第二的事件与目标风险模型中排序第二的事件类型进行匹配;将目标事件子集中排序第三的事件与目标风险模型中排序第三的事件类型进行匹配;依次类推,若匹配成功,则确定目标事件子集属于风险事件子集,其中目标事件子集为目标事件集对应的任一事件子集。
S702、将目标事件子集所属的目标事件集确定为风险事件集。
可选地,当目标事件子集被确定为风险事件子集时,则目标事件子集对应的目标事件集则被确定为风险事件集。
可选地,步骤S701中,若目标事件子集中依次排列的各事件分别与目标风险模型中包含的事件类型序列中各事件类型依次匹配成功,则确定目标事件子集属于风险事件子集,可以包括:若目标事件子集中依次排列的各事件的类型分别与目标风险模型中对应排列的事件类型相同,则确定目标事件子集属于风险事件子集。
可选地,当目标事件子集中排序第一的事件的类型与目标风险模型中排序第一的事件类型相同,则认为目标事件子集中排序第一的事件与目标风险模型中排序第一的事件类型匹配成功;同理,当目标事件子集中排序第二的事件的类型与目标风险模型中排序第二的事件类型相同,则认为目标事件子集中排序第二的事件与目标风险模型中排序第二的事件类型匹配成功;当目标事件子集中排序第三的事件的类型与目标风险模型中排序第三的事件类型相同,则认为目标事件子集中排序第三的事件与目标风险模型中排序第三的事件类型匹配成功。当且仅当目标事件子集中各事件分别与目标风险模型中各事件类型匹配成功时,则确定目标事件子集属于风险事件子集。
在一些情况下,当目标事件子集中包含的事件数量与目标风险模型中包含的事件类型数量不一致时,则目标事件子集与目标风险模型匹配失败;仅在目标事件子集中包含的事件数量与目标风险模型中包含的事件类型数量一致时,目标事件子集与目标风险模型才有可能匹配成功。
例如:目标事件子集中包含2个事件,而目标风险模型中包含3个事件类型,那么,由于目标事件子集中不包含排序第三的事件,也即排序第三的事件为空,那么,目标事件子集中则不包含与目标风险模型中排序第三的事件类型匹配的事件,故目标事件子集与目标风险模型匹配失败。
在一种可实现的方式中,本实施例中风险场景对应的风险模型可以为单独的风险模型,也可以为整个风险模型的一条分支,也即,一些风险场景下也对应构建有多个风险模型,以能够提高风险信息计算的准确性,当风险场景对应多个风险模型时,本方法的实现步骤依然使用,区别仅在于,针对目标事件集中各事件子集,需要将每个事件子集均与每个风险模型均进行匹配。
如下将通过一个具体的示例对本申请的业务数据处理方法进行说明。
定义风险场景为信息泄露,对应构建的风险模型为:绑定银行卡1-输入验证码2-交易3;设定预设的维度为用户,预设的逻辑顺序为时间顺序及序号顺序。
根据风险模型中各事件类型对应的行为特征集合,对获取的用户的业务操作数据进行抽取,假设抽取得到的事件如表1所示:
表1
比如:事件a1可以是在APP1上绑定银行卡,事件a2可以是在APP2上绑定银行卡,其均属于绑定银行卡这类事件。
图8为本申请实施例提供的一种业务操作数据处理示意图。如图8所示,经过数据抽取后,得到12个事件,分别包括:a1-a5,b1-b3,c1-c4;针对抽取出的12个事件,可按照各事件的用户标识,进行事件分组,得到的3个初始事件集,分别为用户001对应的(a1,a2,a5,b3,c1)、用户002对应的(a3,b1,c2,c3)、用户003对应的(a4,b2,c4),对各初始事件集按照时间顺序和序号顺序进行排列后,则可分别得到目标事件集,其中,用户001对应的目标事件集为(a1,a2,b3,c1,a5,)、用户002对应的目标事件集为(b1,c2,a3,c3)、用户003对应的目标事件集为(a4,b2,c4)。
接下来采用本方法的栈运算方式,对各目标事件集进行事件子集的分割,这里以用户001对应的目标事件集(a1,a2,b3,c1,a5,)的分割为例:
a.获取事件a1,栈中为空,a1作为当前的栈顶元素,栈中元素:a1;
b.获取事件a2,栈顶元素a1与a2为同类事件,舍弃a2,栈中元素:a1;
c.获取事件b3,栈顶元素a1序号低于b3,b3入栈,b3作为当前的栈顶元素,栈中元素:b3、a1;
d.获取事件c1,栈顶元素b3序号低于c1,c1入栈,c1作为当前的栈顶元素,栈中元素:c1、b3、a1;
e.获取事件a5,栈顶元素c1序号高于a5,栈中元素全部出栈,也即(c1、b3、a1)依次出栈,得到事件子集(a1,b3,c1)。此时,a5入栈,作为新的栈队的栈顶元素,栈中元素:a5;
f.目标事件集已空,事件遍历完成,将栈中元素全部出栈(a5),得到事件子集(a5)。
由此可得到用户001对应的目标事件集的事件子集包括2个,分别为:(a1,b3,c1)、(a5);用户002对应的目标事件集的事件子集包括2个,分别为:(b1,c2)、(a3,c3);用户003对应的目标事件集的事件子集包括1个:(a4,b2,c4)。
其中,在得到用户001对应的目标事件集的事件子集(a1,b3,c1)后,此时还在对目标事件集中的事件a5进行栈运算,但与此同时,可立刻将事件子集(a1,b3,c1)与目标风险模型(绑定银行卡1-输入验证码2-交易3)进行匹配,也即栈运算和模型匹配同步进行,以提高效率。
由于事件子集中事件a1的类型与绑定银行卡相同,也即事件a1就是在绑定银行卡,那么,事件a1与事件类型(绑定银行卡)匹配,同理,事件b3与事件类型(输入验证码)匹配,事件c1与事件类型(交易)匹配,那么,则可确定事件子集(a1,b3,c1)与目标风险模型匹配成功。而事件子集(a5)由于仅包含1个事件,事件子集中不包含输入验证码和交易类型的事件,则事件子集(a5)与目标风险模型匹配不成功。
基于用户001对应的目标事件集的事件子集(a1,b3,c1)与目标风险模型匹配成功,那么可确定用户001对应的目标事件集为风险事件集,即使事件子集(a5)与目标风险模型匹配不成功,只要有一个事件子集匹配成功,则算成功。
由于用户001对应的目标事件集为风险事件集,那么,则可确定用户001的业务操作存在风险,具体可认为用户001的业务操作存在信息泄露的风险。
又以用户002对应的目标事件集的事件子集(a3,c3)与目标风险模型的匹配为例,虽然事件a3与事件类型(绑定银行卡)匹配,但是事件c3与事件类型(输入验证码)并不匹配,事件c3属于交易事件,故可确定事件子集(a3,c3)与目标风险模型不匹配,同时,用户002对应的目标事件集的事件子集(b1,c2)也与目标风险模型不匹配,那么则可确定用户002对应的目标事件集不属于风险事件集,用户002的业务操作不存在信息泄露的风险。
综上所述,本实施例提供的业务数据处理方法,通过从目标对象的业务操作数据中进行事件抽取可得到目标对象所执行的多个事件,按照预设的维度和预设的逻辑顺序对多个事件进行分组排序后可得到针对目标对象的目标事件集;而基于目标事件集中各事件的序号对目标事件集进行事件子集的分割,由于各事件的序号是根据目标风险模型中事件类型序列中各事件类型的序号确定的,这样可最大程度上从目标事件集中分割出与目标风险模型中的事件类型序列匹配的事件子集,从而根据事件子集与目标风险模型的匹配结果,确定目标事件集的风险信息,而目标事件集的风险信息则可以用于帮助企业进行运维管理分析。其中,通过事件抽取以及生成事件子集,可精确的从目标对象的业务操作数据中捕捉到满足风险模型的事件序列,从而提升事件集风险信息的判定准确性。
其次,本实施例根据事件的序号,采用栈运算对分组排序后的目标事件集进行循环切割,得到目标事件集对应的事件子集,所有目标事件集中所有的事件最多仅需入栈一次,不存在反复压栈情况,运算效率高。且栈运算可有效控制栈内包含的事件的数量,使得能够精确的切割得到与目标风险模型匹配的事件子集,极大的提高了模型匹配的精准性。
另外,本实施例中当风险场景下的风险模型数量为多个时,对于事件的抽取分组排序得到事件子集的运算方式依然适用,无论是单个风险模型还是一组风险模型,均可共用一套预设维度、预设逻辑顺序和栈运算方式,仅需在风险模型匹配时增加匹配量而已。
下述对用以执行本申请所提供的业务操作数据方法的装置、设备及存储介质等进行说明,其具体的实现过程以及技术效果参见上述,下述不再赘述。
图9为本申请实施例提供的一种业务操作数据处理装置的示意图,该业务操作数据处理装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述的计算机设备,如图9所示,该装置可包括:获取模块910、处理模块920、生成模块930、匹配模块940;
获取模块910,用于对目标对象的业务操作数据进行事件抽取,得到多个事件;
处理模块920,用于按照预设的维度以及预设的逻辑顺序对多个事件进行分组排序处理,得到至少一个目标事件集;
生成模块930,用于根据目标事件集中各事件的序号,生成目标事件集对应的至少一个事件子集,其中,事件的序号用于表征事件所属的事件类型在目标风险模型中的排序,目标风险模型包括目标业务场景下存在风险的至少一个事件类型序列;
匹配模块940,用于根据目标事件集对应的各事件子集与目标风险模型的匹配结果,确定目标事件集的风险信息。
可选地,生成模块930,具体用于根据目标事件集中各事件的序号,对目标事件集中各事件进行栈运算,并基于栈运算的结果得到至少一个事件子集。
可选地,生成模块930,具体用于遍历目标事件集中的各事件,将排序第一的事件作为初始的栈顶元素进行入栈,得到初始的栈队;
由排序第二的事件为起始,依次获取各事件,并将各事件分别与当前的栈顶元素进行比对,根据比对结果,更新当前的栈顶元素以及构建新的栈队;
当目标事件集中各事件遍历完成,分别将构建的各栈队中的事件组合为一个事件子集。
可选地,生成模块930,具体用于若当前获取的事件的事件序号与当前的栈顶元素的事件序号相同,则将当前获取的事件丢弃;
若当前获取的事件的事件序号所表征的排序在当前的栈顶元素的事件序号所表征的排序之后,则将当前获取的事件作为新的栈顶元素加入初始的栈队;
若当前获取的事件的事件序号所表征的排序在当前的栈顶元素的事件序号所表征的排序之前,则将初始的栈队确定为目标事件集对应的一个事件子集,将栈队的元素出栈,并将当前获取的事件作为当前新的栈顶元素入栈,构建新的栈队,重复执行,直至遍历完目标事件集中的所有事件。
可选地,获取模块910,具体用于根据目标风险模型中的各事件类型,确定各事件类型对应的行为特征集合;
采用各事件类型对应的行为特征集合对业务操作数据进行事件抽取,得到多个事件。
可选地,获取模块910,具体用于根据各事件类型对应的行为特征集合中的各行为属性信息,从业务操作数据中抽取与各行为属性信息匹配的数据;
根据抽取的与各行为属性信息匹配的数据,生成多个事件。
可选地,处理模块920,具体用于按照预设的维度对多个事件进行分组,得到至少一个初始事件集;
按照预设的逻辑顺序分别对各初始事件集中的事件进行排序,得到至少一个目标事件集。
可选地,预设的维度包括:用户标识,预设的逻辑顺序包括:时间顺序和事件序号顺序;
可选地,处理模块920,具体用于根据各事件的用户标识,将用户标识相同的各事件划分至同一初始事件集;
可选地,处理模块920,具体用于根据各初始事件集中各事件的发生时间,按照发生时间先后顺序依次将各事件进行排序,其中,对于发生时间相同的各事件,按照事件序号顺序依次排序,得到至少一个事件集。
可选地,匹配模块940,具体用于将目标事件集对应的各事件子集分别与目标风险模型进行匹配;
若目标事件集对应的各事件子集中至少一个事件子集与目标风险模型匹配成功,则确定目标事件集属于风险事件集;
若目标事件集对应的各事件子集与目标风险模型均未匹配成功,则确定目标事件集属于正常事件集。
可选地,匹配模块940,具体用于将目标事件集对应的各事件子集分别与目标风险模型进行匹配,若目标事件子集中依次排列的各事件分别与目标风险模型中包含的事件类型序列中各事件类型依次匹配成功,则确定目标事件子集属于风险事件子集;
将目标事件子集所属的目标事件集确定为风险事件集。
可选地,匹配模块940,具体用于若目标事件子集中依次排列的各事件的类型分别与目标风险模型中对应排列的事件类型相同,则确定目标事件子集属于风险事件子集。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
上述模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等,或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接,或其任意组合。两个或更多个模块可以组合为单个模块,并且任何一个模块可以分成两个或更多个单元。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。
图10为本申请实施例提供的一种电子设备的结构示意图,该设备包括:处理器801、存储器802。
存储器802用于存储程序,处理器801调用存储器802存储的程序,以执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
其中,存储器802存储有程序代码,当程序代码被处理器801执行时,使得处理器801执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的方法中的各种步骤。
处理器801可以是通用处理器,例如中央处理器(CPU)、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器802作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random Access Memory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器802还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
可选地,本申请还提供一种程序产品,例如计算机可读存储介质,包括程序,该程序在被处理器执行时用于执行上述方法实施例。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (14)
1.一种业务数据处理方法,其特征在于,包括:
对目标对象的业务操作数据进行事件抽取,得到多个事件;
按照预设的维度以及预设的逻辑顺序对所述多个事件进行分组排序处理,得到至少一个目标事件集;
根据所述目标事件集中各事件的序号,生成所述目标事件集对应的至少一个事件子集,其中,所述事件的序号用于表征所述事件所属的事件类型在目标风险模型中的排序,所述目标风险模型包括目标业务场景下存在风险的至少一个事件类型序列;
根据所述目标事件集对应的各事件子集与所述目标风险模型的匹配结果,确定所述目标事件集的风险信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标事件集中各事件的序号,生成所述目标事件集对应的至少一个事件子集,包括:
根据所述目标事件集中各事件的序号,对所述目标事件集中各事件进行栈运算,并基于栈运算的结果得到所述至少一个事件子集。
3.根据权利要求2所述的方法,其特征在于,根据所述目标事件集中各事件的序号,对所述目标事件集中各事件进行栈运算,并基于栈运算的结果得到所述至少一个事件子集,包括:
遍历所述目标事件集中的各事件,将排序第一的事件作为初始的栈顶元素进行入栈,得到初始的栈队;
由排序第二的事件为起始,依次获取各事件,并将各事件分别与当前的栈顶元素进行比对,根据比对结果,更新当前的栈顶元素以及构建新的栈队;
当所述目标事件集中各事件遍历完成,分别将构建的各栈队中的事件组合为一个事件子集。
4.根据权利要求3所述的方法,其特征在于,所述将各事件分别与当前的栈顶元素进行比对,根据比对结果,更新当前的栈顶元素以及构建新的栈队,包括:
若当前获取的事件的事件序号与当前的栈顶元素的事件序号相同,则将当前获取的事件丢弃;
若当前获取的事件的事件序号所表征的排序在当前的栈顶元素的事件序号所表征的排序之后,则将当前获取的事件作为新的栈顶元素加入所述初始的栈队;
若当前获取的事件的事件序号所表征的排序在当前的栈顶元素的事件序号所表征的排序之前,则将所述初始的栈队确定为所述目标事件集对应的一个事件子集,将栈队的元素出栈,并将所述当前获取的事件作为当前新的栈顶元素入栈,构建新的栈队,重复执行,直至遍历完所述目标事件集中的所有事件。
5.根据权利要求1所述的方法,其特征在于,所述对目标对象的业务操作数据进行事件抽取,得到多个事件,包括:
根据所述目标风险模型中的各事件类型,确定各事件类型对应的行为特征集合;
采用所述各事件类型对应的行为特征集合对所述业务操作数据进行事件抽取,得到多个事件。
6.根据权利要求5所述的方法,其特征在于,所述采用所述各事件类型对应的行为特征集合对所述业务操作数据进行事件抽取,得到多个事件,包括:
根据各事件类型对应的行为特征集合中的各行为属性信息,从所述业务操作数据中抽取与各行为属性信息匹配的数据;
根据抽取的与各行为属性信息匹配的数据,生成多个事件。
7.根据权利要求1所述的方法,其特征在于,所述按照预设的维度以及预设的逻辑顺序对所述多个事件进行分组排序处理,得到至少一个目标事件集,包括:
按照所述预设的维度对所述多个事件进行分组,得到至少一个初始事件集;
按照所述预设的逻辑顺序分别对各所述初始事件集中的事件进行排序,得到所述至少一个目标事件集。
8.根据权利要求7所述的方法,其特征在于,所述预设的维度包括:用户标识,所述预设的逻辑顺序包括:时间顺序和事件序号顺序;
所述按照所述预设的维度对所述多个事件进行分组,得到至少一个初始事件集,包括:
根据各事件的用户标识,将用户标识相同的各事件划分至同一初始事件集;
所述按照所述预设的逻辑顺序分别对各所述初始事件集中的事件进行排序,得到所述至少一个目标事件集,包括:
根据各初始事件集中各事件的发生时间,按照发生时间先后顺序依次将各事件进行排序,其中,对于发生时间相同的各事件,按照所述事件序号顺序依次排序,得到所述至少一个事件集。
9.根据权利要求1所述的方法,其特征在于,所述根据所述目标事件集对应的各事件子集与所述目标风险模型的匹配结果,确定所述目标事件集的风险信息,包括:
将目标事件集对应的各事件子集分别与所述目标风险模型进行匹配;
若目标事件集对应的各事件子集中至少一个事件子集与所述目标风险模型匹配成功,则确定所述目标事件集属于风险事件集;
若目标事件集对应的各事件子集与所述目标风险模型均未匹配成功,则确定所述目标事件集属于正常事件集。
10.根据权利要求9所述的方法,其特征在于,所述若目标事件集对应的各事件子集中至少一个事件子集与所述目标风险模型匹配成功,则确定所述目标事件集属于风险事件集,包括:
将所述目标事件集对应的各事件子集分别与所述目标风险模型进行匹配,若目标事件子集中依次排列的各事件分别与所述目标风险模型中包含的事件类型序列中各事件类型依次匹配成功,则确定所述目标事件子集属于风险事件子集;
将目标事件子集所属的目标事件集确定为风险事件集。
11.根据权利要求10所述的方法,其特征在于,所述若目标事件子集中依次排列的各事件分别与所述目标风险模型中包含的事件类型序列中各事件类型依次匹配成功,则确定所述目标事件子集属于风险事件子集,包括:
若所述目标事件子集中依次排列的各事件的类型分别与所述目标风险模型中对应排列的事件类型相同,则确定所述目标事件子集属于风险事件子集。
12.一种业务数据处理装置,其特征在于,包括:获取模块、处理模块、生成模块、匹配模块;
所述获取模块,用于对目标对象的业务操作数据进行事件抽取,得到多个事件;
所述处理模块,用于按照预设的维度以及预设的逻辑顺序对所述多个事件进行分组排序处理,得到至少一个目标事件集;
所述生成模块,用于根据所述目标事件集中各事件的序号,生成所述目标事件集对应的至少一个事件子集,其中,所述事件的序号用于表征所述事件所属的事件类型在目标风险模型中的排序,所述目标风险模型包括目标业务场景下存在风险的至少一个事件类型序列;
所述匹配模块,用于根据所述目标事件集对应的各事件子集与所述目标风险模型的匹配结果,确定所述目标事件集的风险信息。
13.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的程序指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述程序指令,以执行时执行如权利要求1至11任一所述的业务数据处理方法的步骤。
14.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至11任一所述的业务数据处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211203754.8A CN115687599B (zh) | 2022-09-29 | 2022-09-29 | 业务数据处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211203754.8A CN115687599B (zh) | 2022-09-29 | 2022-09-29 | 业务数据处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115687599A true CN115687599A (zh) | 2023-02-03 |
CN115687599B CN115687599B (zh) | 2023-10-31 |
Family
ID=85064217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211203754.8A Active CN115687599B (zh) | 2022-09-29 | 2022-09-29 | 业务数据处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115687599B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060074621A1 (en) * | 2004-08-31 | 2006-04-06 | Ophir Rachman | Apparatus and method for prioritized grouping of data representing events |
CN102012918A (zh) * | 2010-11-26 | 2011-04-13 | 中金金融认证中心有限公司 | 一种规律挖掘和执行系统及其方法 |
CN102571469A (zh) * | 2010-12-23 | 2012-07-11 | 北京启明星辰信息技术股份有限公司 | 攻击检测方法和装置 |
CN106295382A (zh) * | 2015-05-20 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 一种信息风险防控方法及装置 |
CN107704387A (zh) * | 2017-09-26 | 2018-02-16 | 恒生电子股份有限公司 | 用于系统预警的方法、装置、电子设备及计算机可读介质 |
CN111260215A (zh) * | 2020-01-15 | 2020-06-09 | 中国平安财产保险股份有限公司 | 风险预警方法及相关装置 |
CN112163413A (zh) * | 2020-10-26 | 2021-01-01 | 北京明略软件系统有限公司 | 告警事件规则的解析方法、装置、电子设备及存储介质 |
CN112750028A (zh) * | 2020-12-30 | 2021-05-04 | 北京知因智慧科技有限公司 | 基于实体抽取的事件文本的风险预警方法和装置 |
CN113032543A (zh) * | 2021-04-27 | 2021-06-25 | 中国平安人寿保险股份有限公司 | 基于栈结构的对话诊断方法、装置、设备及介质 |
CN113626213A (zh) * | 2021-03-31 | 2021-11-09 | 中汽创智科技有限公司 | 一种事件处理方法、装置、设备及计算机可读存储介质 |
CN114143020A (zh) * | 2021-09-06 | 2022-03-04 | 北京许继电气有限公司 | 一种基于规则的网络安全事件关联分析方法和系统 |
-
2022
- 2022-09-29 CN CN202211203754.8A patent/CN115687599B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060074621A1 (en) * | 2004-08-31 | 2006-04-06 | Ophir Rachman | Apparatus and method for prioritized grouping of data representing events |
CN102012918A (zh) * | 2010-11-26 | 2011-04-13 | 中金金融认证中心有限公司 | 一种规律挖掘和执行系统及其方法 |
CN102571469A (zh) * | 2010-12-23 | 2012-07-11 | 北京启明星辰信息技术股份有限公司 | 攻击检测方法和装置 |
CN106295382A (zh) * | 2015-05-20 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 一种信息风险防控方法及装置 |
CN107704387A (zh) * | 2017-09-26 | 2018-02-16 | 恒生电子股份有限公司 | 用于系统预警的方法、装置、电子设备及计算机可读介质 |
CN111260215A (zh) * | 2020-01-15 | 2020-06-09 | 中国平安财产保险股份有限公司 | 风险预警方法及相关装置 |
CN112163413A (zh) * | 2020-10-26 | 2021-01-01 | 北京明略软件系统有限公司 | 告警事件规则的解析方法、装置、电子设备及存储介质 |
CN112750028A (zh) * | 2020-12-30 | 2021-05-04 | 北京知因智慧科技有限公司 | 基于实体抽取的事件文本的风险预警方法和装置 |
CN113626213A (zh) * | 2021-03-31 | 2021-11-09 | 中汽创智科技有限公司 | 一种事件处理方法、装置、设备及计算机可读存储介质 |
CN113032543A (zh) * | 2021-04-27 | 2021-06-25 | 中国平安人寿保险股份有限公司 | 基于栈结构的对话诊断方法、装置、设备及介质 |
CN114143020A (zh) * | 2021-09-06 | 2022-03-04 | 北京许继电气有限公司 | 一种基于规则的网络安全事件关联分析方法和系统 |
Non-Patent Citations (1)
Title |
---|
徐建国;蔺珍;张鹏;徐明磊;李恒忠;: "网络舆情热点获取与分析算法研究", 软件导刊, no. 05, pages 99 - 103 * |
Also Published As
Publication number | Publication date |
---|---|
CN115687599B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107038182B (zh) | 分表数据的完备性检查方法及装置 | |
CN109816503A (zh) | 财务明细数据生成方法、装置、计算机设备和存储介质 | |
CN109949154A (zh) | 客户信息分类方法、装置、计算机设备和存储介质 | |
CN109284920A (zh) | 基于大数据的用户信息风险评定的方法及系统 | |
CN110706105A (zh) | 差错标记方法、装置、计算机设备及存储介质 | |
CN109214904A (zh) | 财务造假线索的获取方法、装置、计算机设备和存储介质 | |
CN115269437A (zh) | 测试用例推荐方法、装置、计算机设备及存储介质 | |
CN113837584A (zh) | 业务处理系统和基于业务处理系统的异常数据处理方法 | |
CN115687599A (zh) | 业务数据处理方法、装置、电子设备及存储介质 | |
CN112419052B (zh) | 交易测试方法、装置、电子设备及可读存储介质 | |
CN113592529B (zh) | 债券产品的潜在客户推荐方法和装置 | |
CN109324963A (zh) | 自动测试收益结果的方法及终端设备 | |
AU2019404304B2 (en) | Gain and loss computation for cryptocurrency transactions | |
CN114511314A (zh) | 一种支付账户管理的方法、装置、计算机设备和存储介质 | |
US20210056549A1 (en) | Gain and loss computation for cryptocurrency transactions | |
CN113868283A (zh) | 数据测试方法、装置、设备及计算机存储介质 | |
CN109754151B (zh) | 基于交易数据的地铁站点识别方法、装置、设备及介质 | |
CN110489438A (zh) | 一种客户行为信息处理方法及装置 | |
JP2015008019A (ja) | データ照合装置、データ照合方法及びプログラム | |
CN106815289B (zh) | 一种交易处理系统中的数据存储方法及装置 | |
US11861384B2 (en) | Methods and systems for generating recommendations based on explainable decision trees for users of a software application | |
CN112749167A (zh) | 确定断链数据的方法、装置及非易失性存储介质 | |
CN115330370A (zh) | 账单管理方法、装置、设备及存储介质 | |
CN115563943A (zh) | 一种报表处理方法、装置、设备及存储介质 | |
CN115510827A (zh) | 基于行数据类型标签的数据处理方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |