CN117294492A

CN117294492A - 异常行为检测方法、装置、电子设备及存储介质

Info

Publication number: CN117294492A
Application number: CN202311230281.5A
Authority: CN
Inventors: 方木龙; 黄伟湘; 邱浚漾; 苏卓涵; 熊冰林; 梁晓锋; 孙志佳; 张沛源; 欧哲
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Internet Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Internet Co Ltd
Priority date: 2023-09-21
Filing date: 2023-09-21
Publication date: 2023-12-26

Abstract

本公开提出了一种异常行为检测方法、装置、电子设备及存储介质，该方法包括：获取待检测用户的用户标识、设备地址、行为数据和历史登录地址，并获取频繁项集；基于用户标识从频繁项集中获取对应的子频繁项集；基于用户行为数据和子频繁项集中的数据确定待检测用户的第一判断标识，以及基于设备地址和历史登录地址确定待检测用户的第二判断标识；基于第一判断标识和第二判断标识确定待检测用户是否存在异常行为。通过从频繁项集和设备地址两个维度判断待检测用户是否存在异常行为，可以提升待检测用户登录行为管控的准确性，同时本公开中算法挖掘的频繁项集能兼顾对低频用户和高频用户的检测，可以扩大检测范围，提升用户的检测效果和用户体验。

Description

异常行为检测方法、装置、电子设备及存储介质

技术领域

本公开涉及安全技术领域，尤其涉及一种异常行为检测方法、装置、电子设备及存储介质。

背景技术

现有技术中，用户登录行为管控策略主要有两类，第一类是建立规则，限制用户的登录IP，频次等行为。第二类是使用数据挖掘算法用于挖掘关联规则，一般分为两种，第一种是建立已知异常行为特征库，当用户进行访问时，将用户的行为特征与异常行为库进行比对，若匹配则判断用户行为异常，进行用户拦截或者二次增强验证；第二种是建立用户正常行为的特征库，当用户进行访问时，将用户行为特征数据与特征库数据进行比对，当匹配时，判定为正常行为，当用户行为特征偏离正常行为特征超过设定阈值时，判断该用户行为为异常行为，进行用户拦截或者二次增强验证。

发明内容

本公开旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本公开的一个目的在于提出一种异常行为检测方法。

本公开的第二个目的在于提出一种异常行为检测装置。

本公开的第三个目的在于提出一种电子设备。

本公开的第四个目的在于提出一种非瞬时计算机可读存储介质。

本公开的第五个目的在于提出一种计算机程序产品。

为达上述目的，本公开第一方面实施方式提出了一种异常行为检测方法，包括：获取待检测用户的用户标识、设备地址、行为数据和历史登录地址，并获取频繁项集；基于所述用户标识从所述频繁项集中获取对应的子频繁项集；基于所述用户行为数据和所述子频繁项集中的数据确定待检测用户的第一判断标识，以及基于所述设备地址和所述历史登录地址确定待检测用户的第二判断标识；基于所述第一判断标识和所述第二判断标识确定所述待检测用户是否存在异常行为。

根据本公开的一个实施方式，生成所述频繁项集，包括：获取所有用户的历史用户数据以及所述历史用户数据的数据量；针对任一用户，获取所述用户数据中的特征数据，以及基于所述数据量确定所述用户对应的最小支持度；基于所有用户的特征数据和最小支持度生成所述频繁项集。

根据本公开的一个实施方式，所述基于所有用户的特征数据和最小支持度生成所述频繁项集，包括：针对任一用户，基于所述特征数据生成所述用户的正常子规则库和异常子规则库；基于所述最小支持度，将所述正常子规则库更新至所述最小支持度对应的正常子频繁项集中，和/或将所述异常子规则库更新至所述最小支持度对应的异常子频繁项集中，直至所有用户的用户数据更新完成，生成所述频繁项集。

根据本公开的一个实施方式，所述基于所述特征数据生成所述用户的正常子规则库和异常子规则库，包括：基于Apriori算法对所述特征数据中的正常数据和异常数据进行频繁模式挖掘，以产生关联规则；基于所述关联规则生成所述正常子规则库和所述异常子规则库。

根据本公开的一个实施方式，所述基于所述用户行为数据和所述子频繁项集中的数据确定待检测用户的第一判断标识，包括：基于所述行为数据与所述子频繁项集中所述用户对应的正常子规则库中的规则确定第一相似度，以及基于所述行为数据与所述子频繁项集中所述用户对应的异常子规则库中的规则确定第二相似度；基于所述第一相似度和所述第二相似度，确定所述待检测用户的第一判断标识。

根据本公开的一个实施方式，所述基于所述第一相似度和所述第二相似度，确定所述待检测用户的第一判断标识，包括：将所述第一相似度与第一相似度阈值进行比较，以及将所述第二相似度与第二相似度阈值进行比较；响应于所述第一相似度小于所述第一相似度阈值且所述第二相似度小于所述第二相似度阈值，确定所述待检测用户的第一判断标识为第一正常标识；或者，响应于所述第一相似度大于或者等于所述第一相似度阈值和/或所述第二相似度大于或者等于所述第二相似度阈值，确定所述待检测用户的第一判断标识为第一异常标识。

根据本公开的一个实施方式，所述基于所述设备地址和所述历史登录地址确定待检测用户的第二判断标识，包括：将所述设备地址和所述历史登录地址进行匹配；响应于所述历史登录地址中存在与所述设备地址中相同的地址，确定所述第二判断标识为第二正常标识；或者，响应于所述历史登录地址中不存在与所述设备地址中相同的地址，确定所述第二判断标识为第二异常标识。

根据本公开的一个实施方式，所述基于所述第一判断标识和所述第二判断标识确定所述待检测用户是否存在异常行为，包括：响应于所述第一判断标识为第一正常标识且所述第二判断标识为第二正常标识，确定所述待检测用户不存在异常行为；或者，响应于所述第一判断标识为第一异常标识和/或所述第二判断标识为第二异常标识，确定所述待检测用户存在异常行为。

根据本公开的一个实施方式，所述获取所述用户数据中的特征数据，包括：对所述用户数据进行预处理，以生成候选用户数据；对所述候选用户数据进行特征提取，以获取所述用户数据中的特征数据。

根据本公开的一个实施方式，所述基于所述数据量确定所述用户对应的最小支持度，包括：获取数据量-最小支持度映射表，基于所述数据量在所述数据量-最小支持度映射表进行查表，以确定所述数据量对应的最小支持度。

为达上述目的，本公开第二方面实施例提出了一种异常行为检测装置，包括：获取模块，用于获取待检测用户的用户标识、设备地址、行为数据和历史登录地址，并获取频繁项集；生成模块，用于基于所述用户标识从所述频繁项集中获取对应的子频繁项集；标记模块，用于基于所述用户行为数据和所述子频繁项集中的数据确定待检测用户的第一判断标识，以及基于所述设备地址和所述历史登录地址确定待检测用户的第二判断标识；判断模块，用于基于所述第一判断标识和所述第二判断标识确定所述待检测用户是否存在异常行为。

根据本公开的一个实施方式，所述生成模块，还用于：获取所有用户的历史用户数据以及所述历史用户数据的数据量；针对任一用户，获取所述用户数据中的特征数据，以及基于所述数据量确定所述用户对应的最小支持度；基于所有用户的特征数据和最小支持度生成所述频繁项集。

根据本公开的一个实施方式，所述生成模块，还用于：针对任一用户，基于所述特征数据生成所述用户的正常子规则库和异常子规则库；基于所述最小支持度，将所述正常子规则库更新至所述最小支持度对应的正常子频繁项集中，和/或将所述异常子规则库更新至所述最小支持度对应的异常子频繁项集中，直至所有用户的用户数据更新完成，生成所述频繁项集。

根据本公开的一个实施方式，所述生成模块，还用于：基于Apriori算法对所述特征数据中的正常数据和异常数据进行频繁模式挖掘，以产生关联规则；基于所述关联规则生成所述正常子规则库和所述异常子规则库。

根据本公开的一个实施方式，所述标记模块，还用于：基于所述行为数据与所述子频繁项集中所述用户对应的正常子规则库中的规则确定第一相似度，以及基于所述行为数据与所述子频繁项集中所述用户对应的异常子规则库中的规则确定第二相似度；基于所述第一相似度和所述第二相似度，确定所述待检测用户的第一判断标识。

根据本公开的一个实施方式，所述标记模块，还用于：将所述第一相似度与第一相似度阈值进行比较，以及将所述第二相似度与第二相似度阈值进行比较；响应于所述第一相似度小于所述第一相似度阈值且所述第二相似度小于所述第二相似度阈值，确定所述待检测用户的第一判断标识为第一正常标识；或者，响应于所述第一相似度大于或者等于所述第一相似度阈值和/或所述第二相似度大于或者等于所述第二相似度阈值，确定所述待检测用户的第一判断标识为第一异常标识。

根据本公开的一个实施方式，所述标记模块，还用于：将所述设备地址和所述历史登录地址进行匹配；响应于所述历史登录地址中存在与所述设备地址中相同的地址，确定所述第二判断标识为第二正常标识；或者，响应于所述历史登录地址中不存在与所述设备地址中相同的地址，确定所述第二判断标识为第二异常标识。

根据本公开的一个实施方式，所述判断模块，还用于：响应于所述第一判断标识为第一正常标识且所述第二判断标识为第二正常标识，确定所述待检测用户不存在异常行为；或者，响应于所述第一判断标识为第一异常标识和/或所述第二判断标识为第二异常标识，确定所述待检测用户存在异常行为。

根据本公开的一个实施方式，所述生成模块，还用于：对所述用户数据进行预处理，以生成候选用户数据；对所述候选用户数据进行特征提取，以获取所述用户数据中的特征数据。

根据本公开的一个实施方式，所述生成模块，还用于：获取数据量-最小支持度映射表，基于所述数据量在所述数据量-最小支持度映射表进行查表，以确定所述数据量对应的最小支持度。

为达上述目的，本公开第三方面实施例提出了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以实现如本公开第一方面实施例所述的异常行为检测方法。

为达上述目的，本公开第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于实现如本公开第一方面实施例所述的异常行为检测方法。

为达上述目的，本公开第五方面实施例提出了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时用于实现如本公开第一方面实施例所述的异常行为检测方法。

由此，通过从频繁项集和设备地址两个维度判断待检测用户是否存在异常行为，可以提升待检测用户登录行为管控的准确性，同时本公开中算法挖掘的频繁项集能兼顾对低频用户和高频用户的检测，可以扩大检测范围，提升用户的检测效果和用户体验。

附图说明

图1是本公开一个实施方式的一种异常行为检测方法的示意图；

图2是本公开一个实施方式的另一种异常行为检测方法的示意图；

图3是本公开一个实施方式的另一种异常行为检测方法的示意图；

图4是本公开一个实施方式的一种异常行为检测装置的示意图；

图5是本公开一个实施方式的一种电子设备的示意图。

具体实施方式

下面详细描述本公开的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本公开，而不能理解为对本公开的限制。

本公开技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。

图1为本公开提出的一种异常行为检测方法的一种示例性实施方式的示意图，如图1所示，该异常行为检测方法包括以下步骤：

S101，获取待检测用户的用户标识、设备地址、行为数据和历史登录地址，并获取频繁项集，待检测用户包括高频用户和低频用户。

本申请实施例的异常行为检测方法可应用于用户在进行异地登录账号的场景中，本申请实施例的异常行为检测的执行主体可为本申请实施例的异常行为检测装置，该异常行为检测装置可以设置在电子设备上。

在本公开实施例中，待检测用户的用户标识、设备地址、行为数据和历史登录地址可为用户在登录时同时上传的。

用户标识为标识待检测用户的身份的数据，该用户标识可为多种，此处不作任何限定，举例来说，用户标识可为待检测用户的电话号码、身份证号码、登录账号等。

需要说明的是，行为数据可包括多种，此处不作任何限定。举例来说，行为数据可包括用户属性数据、时间属性数据、空间属性数据、用户属性数据、以及操作属性数据等，此处不作任何限定。具体地，用户属性数据、时间属性数据、空间属性数据、用户属性数据、以及操作属性数据中各可包含多种信息，此处不作任何限定。举例来说，可通过下表进行表示：

需要说明的是，频繁项集挖掘是数据挖掘研究课题中一个很重要的研究基础，它可以告诉我们在数据集中经常一起出现的变量，为可能的决策提供一些支持。频繁项集挖掘是关联规则、相关性分析、因果关系、序列项集、局部周期性、情节片段等许多重要数据挖掘任务的基础。因此，频繁项集有着很广泛的应用，例如：购物篮数据分析、网页预取、交叉购物、个性化网站、网络入侵检测等。，对频繁项集挖掘算法进行研究的方向大概可归纳为以下四个方面：一、在遍历方向上采取自底向上、自顶向下以及混合遍历的方式；二、在搜索策略上采取深度优先和宽度优先策略；三、在项集的产生上着眼于是否会产生候选项集；四、在数据库的布局上，从垂直和水平两个方向上考虑数据库的布局。对于不同的遍历方式，数据库的搜索策略和布局方式将会产生不同的方法，研究表明，没有什么挖掘算法能同时对所有的定义域和数据类型都优于其他的挖掘算法，也就是说，对于每一种相对较为优秀的算法，它都有它具体的适用场景和环境。

需要说明的是，本公开实施例中的频繁项集，同样可针对低频用户进行建立，以此可以扩大覆盖范围，提升用户检测的准确率和用户体验。

S102，基于用户标识从频繁项集中获取对应的子频繁项集。

需要说明的是，子频繁项集中包含有待检测用户的判断规则，用以判断待检测用户的行为数据是否为正常行为下产生的。可以理解的是，不同的用户对应的判断规则可为不同，此处不作任何限定。

在本公开实施例中，频繁项集可包括多个子频繁项集，每个用户可对应包含且只能对应包含一个子频繁项集。子频繁项集中可包含判断用户行为的规则，需要说明的是，子频繁项集还可再进行细分为多个频繁项集，此处不作任何限定，例如子频繁项集还可再进行细分为正常子频繁项集和异常子频繁项集等。

需要说明的是，每个子频繁项集可设有区别标识，该区别标识与用户标识一一对应，以方便快速查询到与用户标识匹配的频繁项集。

S103，基于用户行为数据和子频繁项集中的数据确定待检测用户的第一判断标识，以及基于设备地址和历史登录地址确定待检测用户的第二判断标识。

在本公开实施例中，基于用户行为数据和子频繁项集中的数据确定待检测用户的第一判断标识的方法可为多种，此处不作任何限定。

可选地，可通过将用户行为数据和子频繁项集中的数据输入至第一判断标识生成模型中，以获取第一判断标识。该第一判断标识生成模型可为提前训练好的，并存储在电子设备的存储空间中，以方便在需要时调取使用。

可选地，还可基于预设算法对用户行为数据和子频繁项集中的数据进行运算，以生成第一判断标识。该预设算法为提前设计好的，并可根据实际的设计需要进行变更，此处不作任何限定。

在本公开实施例中，基于设备地址和历史登录地址确定待检测用户的第二判断标识的方法可为多种，此处不作任何限定。

可选地，可通过将基于设备地址和历史登录地址进行匹配，并基于匹配结果确定第二判断标识。

可选地，可通过将设备地址和历史登录地址输入至第二判断标识生成模型中，以获取第二判断标识。该第二判断标识生成模型可为提前训练好的，并存储在电子设备的存储空间中，以方便在需要时调取使用。

S104，基于第一判断标识和第二判断标识确定待检测用户是否存在异常行为。

在本公开实施例中，基于第一判断标识和第二判断标识确定待检测用户是否存在异常行为的方法可为多种，在一种可能实现的方式中，可通过预设的规则对第一判断标识和第二判断标识进行判断，确定用户是否存在异常行为。该判断规则为提前设定好的，并可根据实际的设计需要进行变更，此处不作任何限定。

在本公开实施例中，首先获取待检测用户的用户标识、设备地址、行为数据和历史登录地址，并获取频繁项集，然后基于用户标识从频繁项集中获取对应的子频繁项集，而后基于用户行为数据和子频繁项集中的数据确定待检测用户的第一判断标识，以及基于设备地址和历史登录地址确定待检测用户的第二判断标识，最后基于第一判断标识和第二判断标识确定待检测用户是否存在异常行为。由此，通过从频繁项集和设备地址两个维度判断待检测用户是否存在异常行为，可以提升待检测用户登录行为管控的准确性，同时本公开中算法挖掘的频繁项集能兼顾对低频用户和高频用户的检测，可以扩大检测范围，提升用户的检测效果和用户体验。

上述实施例中，生成频繁项集，还可通过图2进一步解释，该方法包括：

S201，获取所有用户的历史用户数据以及历史用户数据的数据量。

在本公开实施例中，获取所有用户的历史用户数据的方法可为多种，此处不作任何限定。举例来说，可通过调用服务器中的用户操作数据进行获取，还可通过用户上传的历史操作数据进行获取。

在本公开实施例中，历史用户数据的数据量可为多种，举例来说，可为用户每次进行一个独立操作的数据量，也可为用户针对单独一个系统操作的数据量。

S202，针对任一用户，获取用户数据中的特征数据，以及基于数据量确定用户对应的最小支持度。

在本公开实施例中，可对用户数据进行预处理，以生成候选用户数据，然后对候选用户数据进行特征提取，以获取用户数据中的特征数据。

需要说明的是，对用户数据进行预处理的方法可为多种，此处不作任何限定。举例来说，可对用户数据进行数据集成、数据清理、数据转换以及数据简化处理，根据样本缺失程度，判断样本是否删除；通过样本属性值的分布情况，判断属性值是否存在异常，对异常数据作插补、替换、删除等处理。

在本公开实施例中，基于数据量确定用户对应的最小支持度可通过获取数据量-最小支持度映射表，基于数据量在数据量-最小支持度映射表进行查表，以确定数据量对应的最小支持度。该数据量-最小支持度映射表可如下表所示：

S203，基于所有用户的特征数据和最小支持度生成频繁项集。

在本公开实施例中，针对任一用户，可首先基于特征数据生成用户的正常子规则库和异常子规则库，然后基于最小支持度，将正常子规则库更新至最小支持度对应的正常子频繁项集中，和/或将异常子规则库更新至最小支持度对应的异常子频繁项集中，直至所有用户的用户数据更新完成，生成频繁项集。

需要说明的是，基于特征数据生成用户的正常子规则库和异常子规则库，可首先基于Apriori算法对特征数据中的正常数据和异常数据进行频繁模式挖掘，以产生关联规则，然后基于关联规则生成正常子规则库和异常子规则库。

在本公开实施例中，首先获取所有用户的历史用户数据以及历史用户数据的数据量，然后针对任一用户，获取用户数据中的特征数据，以及基于数据量确定用户对应的最小支持度，最后基于所有用户的特征数据和最小支持度生成频繁项集。由此，通过获取使用用户数据和历史用户数据的数据量，确定最小支持度，以此可以适配于低频用户，提升最终生成的频繁项集的实用性和最终检测用户行为的准确性。

在本公开实施例中，对于每个子频繁项集，可以启用多个进程并行计算，每个进程可配置多个线程，能快速计算出高频用户及低频用户的频繁项集，解决用户量大时原始Apriori算法计算面对大用户数量时计算较慢的问题。理论上只要硬件支持，就可不断增加进程与线程数量，加快计算速度。举例来说，最高数量可设置为该库表的用户数量，例如10-100万条数据/线程。

上述实施例中，基于用户行为数据和子频繁项集中的数据确定待检测用户的第一判断标识，还可通过图3进一步解释，该方法包括：

S301，基于行为数据与子频繁项集中用户对应的正常子规则库中的规则确定第一相似度，以及基于行为数据与子频繁项集中用户对应的异常子规则库中的规则确定第二相似度。

在本公开实施例中，可通过将行为数据、子频繁项集中用户对应的正常子规则库中的规则、子频繁项集中用户对应的异常子规则库中的规则分别生成向量，并通过计算向量之间的向量距离，确定第一相似度和第二相似度。第一相似度和第二相似度越大，则说明二者之间的越不相似，第一相似度和第二相似度越小，则说明二者之间的越相似。

S302，基于第一相似度和第二相似度，确定待检测用户的第一判断标识。

在本公开实施例中，可通过将第一相似度与第一相似度阈值进行比较，以及将第二相似度与第二相似度阈值进行比较，响应于第一相似度小于第一相似度阈值且第二相似度小于第二相似度阈值，确定待检测用户的第一判断标识为第一正常标识。

需要说明的是，第一相似度阈值和第二相似度阈值为提前设定好的，并可根据实际的设计需要进行变更，此处不作任何限定。

在本公开实施例中，首先基于行为数据与子频繁项集中用户对应的正常子规则库中的规则确定第一相似度，以及基于行为数据与子频繁项集中用户对应的异常子规则库中的规则确定第二相似度，然后基于第一相似度和第二相似度，确定待检测用户的第一判断标识。由此，通过将待检测用户的行为数据分别与正常子规则库中的规则和异常子规则库中的规则进行相似度计算，可以快速准确的确定第一判断标识，为后续的判断用户的行为提供数据基础。

在本公开实施例中，基于设备地址和历史登录地址确定待检测用户的第二判断标识，可首先将设备地址和历史登录地址进行匹配，响应于历史登录地址中存在与设备地址中相同的地址，确定第二判断标识为第二正常标识，响应于历史登录地址中不存在与设备地址中相同的地址，确定第二判断标识为第二异常标识。

上述实施例中，基于第一判断标识和第二判断标识确定待检测用户是否存在异常行为，可通过预设的判断规则进行确定。在一种可能实现的方式中，响应于第一判断标识为第一正常标识且第二判断标识为第二正常标识，确定待检测用户不存在异常行为。响应于第一判断标识为第一异常标识和/或第二判断标识为第二异常标识，确定待检测用户存在异常行为。

与上述几种实施例提供的异常行为检测方法相对应，本公开的一个实施例还提供了一种异常行为检测装置，由于本公开实施例提供的异常行为检测装置与上述几种实施例提供的异常行为检测方法相对应，因此上述异常行为检测方法的实施方式也适用于本公开实施例提供的异常行为检测装置，在下述实施例中不再详细描述。

图4为本公开提出的一种异常行为检测装置的示意图，如图4所示，该异常行为检测装置400，包括：获取模块410、生成模块420、标记模块430和判断模块440。

其中，获取模块410，用于获取待检测用户的用户标识、设备地址、行为数据和历史登录地址，并获取频繁项集，待检测用户包括高频用户和低频用户。

生成模块420，用于基于用户标识从频繁项集中获取对应的子频繁项集。

标记模块430，用于基于用户行为数据和子频繁项集中的数据确定待检测用户的第一判断标识，以及基于设备地址和历史登录地址确定待检测用户的第二判断标识。

判断模块440，用于基于第一判断标识和第二判断标识确定待检测用户是否存在异常行为。

在本公开的一个实施例中，生成模块420，还用于：获取所有用户的历史用户数据以及历史用户数据的数据量；针对任一用户，获取用户数据中的特征数据，以及基于数据量确定用户对应的最小支持度；基于所有用户的特征数据和最小支持度生成频繁项集。

在本公开的一个实施例中，生成模块420，还用于：针对任一用户，基于特征数据生成用户的正常子规则库和异常子规则库；基于最小支持度，将正常子规则库更新至最小支持度对应的正常子频繁项集中，和/或将异常子规则库更新至最小支持度对应的异常子频繁项集中，直至所有用户的用户数据更新完成，生成频繁项集。

在本公开的一个实施例中，生成模块420，还用于：基于Apriori算法对特征数据中的正常数据和异常数据进行频繁模式挖掘，以产生关联规则；基于关联规则生成正常子规则库和异常子规则库。

在本公开的一个实施例中，标记模块430，还用于：基于行为数据与子频繁项集中用户对应的正常子规则库中的规则确定第一相似度，以及基于行为数据与子频繁项集中用户对应的异常子规则库中的规则确定第二相似度；基于第一相似度和第二相似度，确定待检测用户的第一判断标识。

在本公开的一个实施例中，标记模块430，还用于：将第一相似度与第一相似度阈值进行比较，以及将第二相似度与第二相似度阈值进行比较；响应于第一相似度小于第一相似度阈值且第二相似度小于第二相似度阈值，确定待检测用户的第一判断标识为第一正常标识；或者，响应于第一相似度大于或者等于第一相似度阈值和/或第二相似度大于或者等于第二相似度阈值，确定待检测用户的第一判断标识为第一异常标识。

在本公开的一个实施例中，标记模块430，还用于：将设备地址和历史登录地址进行匹配；响应于历史登录地址中存在与设备地址中相同的地址，确定第二判断标识为第二正常标识；或者，响应于历史登录地址中不存在与设备地址中相同的地址，确定第二判断标识为第二异常标识。

在本公开的一个实施例中，判断模块440，还用于：响应于第一判断标识为第一正常标识且第二判断标识为第二正常标识，确定待检测用户不存在异常行为；或者，响应于第一判断标识为第一异常标识和/或第二判断标识为第二异常标识，确定待检测用户存在异常行为。

在本公开的一个实施例中，生成模块420，还用于：对用户数据进行预处理，以生成候选用户数据；对候选用户数据进行特征提取，以获取用户数据中的特征数据。

在本公开的一个实施例中，生成模块420，还用于：获取数据量-最小支持度映射表，基于数据量在数据量-最小支持度映射表进行查表，以确定数据量对应的最小支持度。

为了实现上述实施例，本公开实施例还提出一种电子设备500，如图5所示，该电子设备500包括：处理器501和处理器通信连接的存储器502，存储器502存储有可被至少一个处理器执行的指令，指令被至少一个处理器501执行，以实现如本公开第一方面实施例的异常行为检测方法。

为了实现上述实施例，本公开实施例还提出一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机实现如本公开第一方面实施例的异常行为检测方法。

为了实现上述实施例，本公开实施例还提出一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现如本公开第一方面实施例的异常行为检测方法。

在本公开的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本公开和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本公开的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本公开的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本公开的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本公开的限制，本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种异常行为检测方法，其特征在于，包括：

获取待检测用户的用户标识、设备地址、行为数据和历史登录地址，并获取频繁项集，所述待检测用户包括高频用户和低频用户；

基于所述用户标识从所述频繁项集中获取对应的子频繁项集；

基于所述用户行为数据和所述子频繁项集中的数据确定待检测用户的第一判断标识，以及基于所述设备地址和所述历史登录地址确定待检测用户的第二判断标识；

基于所述第一判断标识和所述第二判断标识确定所述待检测用户是否存在异常行为。

2.根据权利要求1所述的方法，其特征在于，生成所述频繁项集，包括：

获取所有用户的历史用户数据以及所述历史用户数据的数据量；

针对任一用户，获取所述用户数据中的特征数据，以及基于所述数据量确定所述用户对应的最小支持度；

基于所有用户的特征数据和最小支持度生成所述频繁项集。

3.根据权利要求2所述的方法，其特征在于，所述基于所有用户的特征数据和最小支持度生成所述频繁项集，包括：

针对任一用户，基于所述特征数据生成所述用户的正常子规则库和异常子规则库；

基于所述最小支持度，将所述正常子规则库更新至所述最小支持度对应的正常子频繁项集中，和/或将所述异常子规则库更新至所述最小支持度对应的异常子频繁项集中，直至所有用户的用户数据更新完成，生成所述频繁项集。

4.根据权利要求3所述的方法，其特征在于，所述基于所述特征数据生成所述用户的正常子规则库和异常子规则库，包括：

基于Apriori算法对所述特征数据中的正常数据和异常数据进行频繁模式挖掘，以产生关联规则；

基于所述关联规则生成所述正常子规则库和所述异常子规则库。

5.根据权利要求4所述的方法，其特征在于，所述基于所述用户行为数据和所述子频繁项集中的数据确定待检测用户的第一判断标识，包括：

基于所述行为数据与所述子频繁项集中所述用户对应的正常子规则库中的规则确定第一相似度，以及基于所述行为数据与所述子频繁项集中所述用户对应的异常子规则库中的规则确定第二相似度；

基于所述第一相似度和所述第二相似度，确定所述待检测用户的第一判断标识。

6.根据权利要求5所述的方法，其特征在于，所述基于所述第一相似度和所述第二相似度，确定所述待检测用户的第一判断标识，包括：

将所述第一相似度与第一相似度阈值进行比较，以及将所述第二相似度与第二相似度阈值进行比较；

响应于所述第一相似度小于所述第一相似度阈值且所述第二相似度小于所述第二相似度阈值，确定所述待检测用户的第一判断标识为第一正常标识；或者，

响应于所述第一相似度大于或者等于所述第一相似度阈值和/或所述第二相似度大于或者等于所述第二相似度阈值，确定所述待检测用户的第一判断标识为第一异常标识。

7.根据权利要求1所述的方法，其特征在于，所述基于所述设备地址和所述历史登录地址确定待检测用户的第二判断标识，包括：

将所述设备地址和所述历史登录地址进行匹配；

响应于所述历史登录地址中存在与所述设备地址中相同的地址，确定所述第二判断标识为第二正常标识；或者，

响应于所述历史登录地址中不存在与所述设备地址中相同的地址，确定所述第二判断标识为第二异常标识。

8.根据权利要求1-7中任一项所述的方法，其特征在于，所述基于所述第一判断标识和所述第二判断标识确定所述待检测用户是否存在异常行为，包括：

响应于所述第一判断标识为第一正常标识且所述第二判断标识为第二正常标识，确定所述待检测用户不存在异常行为；或者，

响应于所述第一判断标识为第一异常标识和/或所述第二判断标识为第二异常标识，确定所述待检测用户存在异常行为。

9.根据权利要求2所述的方法，其特征在于，所述获取所述用户数据中的特征数据，包括：

对所述用户数据进行预处理，以生成候选用户数据；

对所述候选用户数据进行特征提取，以获取所述用户数据中的特征数据。

10.根据权利要求2所述的方法，其特征在于，所述基于所述数据量确定所述用户对应的最小支持度，包括：

获取数据量-最小支持度映射表，基于所述数据量在所述数据量-最小支持度映射表进行查表，以确定所述数据量对应的最小支持度。

11.一种异常行为检测装置，其特征在于，包括：

获取模块，用于获取待检测用户的用户标识、设备地址、行为数据和历史登录地址，并获取频繁项集；

生成模块，用于基于所述用户标识从所述频繁项集中获取对应的子频繁项集；

标记模块，用于基于所述用户行为数据和所述子频繁项集中的数据确定待检测用户的第一判断标识，以及基于所述设备地址和所述历史登录地址确定待检测用户的第二判断标识；

判断模块，用于基于所述第一判断标识和所述第二判断标识确定所述待检测用户是否存在异常行为。

12.根据权利要求11所述的装置，其特征在于，所述生成模块，还用于：

基于所有用户的特征数据和最小支持度生成所述频繁项集。

13.根据权利要求12所述的装置，其特征在于，所述生成模块，还用于：

14.根据权利要求13所述的装置，其特征在于，所述生成模块，还用于：

15.根据权利要求14所述的装置，其特征在于，所述标记模块，还用于：

16.根据权利要求15所述的装置，其特征在于，所述标记模块，还用于：

17.根据权利要求11所述的装置，其特征在于，所述标记模块，还用于：

将所述设备地址和所述历史登录地址进行匹配；

18.根据权利要求11-17中任一项所述的装置，其特征在于，所述判断模块，还用于：

19.根据权利要求12所述的装置，其特征在于，所述生成模块，还用于：

对所述用户数据进行预处理，以生成候选用户数据；

20.根据权利要求12所述的装置，其特征在于，所述生成模块，还用于：

21.一种电子设备，其特征在于，包括存储器、处理器；

其中，所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于实现如权利要求1-10中任一项所述的方法。

22.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1-10中任一项所述的方法。