CN113821815A - 一种基于用户行为的大数据防护方法及服务器 - Google Patents
一种基于用户行为的大数据防护方法及服务器 Download PDFInfo
- Publication number
- CN113821815A CN113821815A CN202111217359.0A CN202111217359A CN113821815A CN 113821815 A CN113821815 A CN 113821815A CN 202111217359 A CN202111217359 A CN 202111217359A CN 113821815 A CN113821815 A CN 113821815A
- Authority
- CN
- China
- Prior art keywords
- risk
- big data
- intention
- behavior
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及基于用户行为的大数据防护方法及服务器,一方面根据行为需求信息集访问获得与待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息,另一方面根据风险意图数据集和第一行为需求信息采集与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据,这样可以尽可能减少风险意图挖掘分析的噪声比例,以提高针对待分析用户行为事件进行风险意图挖掘和分析的准确性和可靠性,此外,通过考虑行为需求和风险意图,能够实现风险意图挖掘分析的层次性以保障风险意图大数据的完整性,这样一来,在以目标风险意图大数据作为数据信息防护分析依据时,能够保障数据信息防护的可信度。
Description
技术领域
本申请实施例涉及大数据防护技术领域,具体涉及一种基于用户行为的大数据防护方法及服务器。
背景技术
用户行为分析(Analysis of Users' Behavior),是指在获得各类服务平台的业务大数据的前提下,对有关用户行为数据进行统计、分析和挖掘,进而发现目前业务服务活动中可能存在的问题,并为进一步修正或重新优化业务服务提供依据。随着大数据应用领域的不断扩展,用户行为分析也逐渐过渡到数据信息安防层面,从数据信息防护角度出发进行用户行为分析是现目前大数据信息防护技术的关键。然而在实际应用过程中发明人发现,相关技术在实施时容易引入过多的噪声,从而难以确保信息防护分析比如风险识别的精度和可信度,在此基础上难以保证数据信息防护的可信度。
发明内容
有鉴于此,本申请实施例提供了一种基于用户行为的大数据防护方法及服务器。
本申请实施例提供了一种基于用户行为的大数据防护方法,应用于大数据防护服务器,所述方法至少包括:采集待分析用户行为事件的业务互动大数据;通过所述待分析用户行为事件的业务互动大数据,访问行为需求信息集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息,其中,所述行为需求信息集涵盖若干行为需求信息;基于所述第一行为需求信息和风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据,其中,所述风险意图数据集涵盖若干风险意图大数据。
在一些可独立实施的设计思路下,所述通过所述待分析用户行为事件的业务互动大数据,访问行为需求信息集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息,包括:确定所述待分析用户行为事件的业务互动大数据的第一行为需求显著性表达;基于所述第一行为需求显著性表达,从所述行为需求信息集所包括的多个行为需求信息中确定所述第一行为需求信息。
在一些可独立实施的设计思路下,所述基于所述第一行为需求显著性表达,从所述行为需求信息集所包括的多个行为需求信息中确定所述第一行为需求信息,包括:确定所述第一行为需求显著性表达与所述多个行为需求信息对应的多个第二行为需求显著性表达中每个第二行为需求显著性表达之间的差异分析结果;将所述多个第二行为需求显著性表达中与所述第一行为需求显著性表达之间的差异分析结果最小或者不超过第一判定值的第二行为需求显著性表达所对应的至少一个行为需求信息确定为所述第一行为需求信息。
在一些可独立实施的设计思路下,所述多个行为需求信息中的至少两个行为需求信息组成配对于同一行为需求的行为需求视觉记录,所述至少两个行为需求信息对应的第二行为需求显著性表达为所述至少两个行为需求信息组成的行为需求视觉记录的去极性显著性表达。
在一些可独立实施的设计思路下,所述基于所述第一行为需求信息和风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据,包括:采集与所述第一行为需求信息对应的第一风险意图大数据;通过所述第一风险意图大数据访问所述风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据。
在一些可独立实施的设计思路下,所述通过所述第一风险意图大数据访问所述风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据,包括:确定所述第一风险意图大数据的第一风险意图显著性表达;基于所述第一风险意图显著性表达,从所述风险意图数据集所包括的多个风险意图大数据中确定与所述第一风险意图大数据存在关联关系的至少一个风险意图大数据,以及将与所述第一风险意图大数据存在关联关系的至少一个风险意图大数据确定为所述目标风险意图大数据。
在一些可独立实施的设计思路下,所述基于所述第一风险意图显著性表达,从所述风险意图数据集所包括的多个风险意图大数据中确定与所述第一风险意图大数据存在关联关系的至少一个风险意图大数据,包括:确定所述第一风险意图显著性表达与所述多个风险意图大数据对应的多个第二风险意图显著性表达中每个第二风险意图显著性表达之间的差异分析结果;将所述多个第二风险意图显著性表达中与所述第一风险意图显著性表达之间的差异分析结果最小或者不超过第二判定值的第二风险意图显著性表达所对应的至少一个风险意图大数据确定为与所述第一风险意图大数据存在关联关系的至少一个风险意图大数据。
在一些可独立实施的设计思路下,所述多个风险意图大数据中的至少两个风险意图大数据组成配对于同一风险意图的风险意图视觉记录,所述至少两个风险意图大数据对应的第二风险意图显著性表达为所述至少两个风险意图大数据组成的风险意图视觉记录的去极性显著性表达。
在一些可独立实施的设计思路下,所述采集与所述第一行为需求信息对应的第一风险意图大数据,包括:确定所述第一行为需求信息所绑定的第一服务会话以及所述第一行为需求信息的分布信息和业务互动大数据描述信息;基于所述第一行为需求信息的分布信息和业务互动大数据描述信息,采集所述第一服务会话中与所述第一行为需求信息对应的第一风险意图大数据。
在一些可独立实施的设计思路下,所述基于所述第一行为需求信息的分布信息和业务互动大数据描述信息,采集所述第一服务会话中与所述第一行为需求信息对应的第一风险意图大数据,包括:如果所述第一服务会话中存在分布与所述第一行为需求信息的分布信息匹配且携带所述第一行为需求信息的风险意图大数据,将所述携带所述第一行为需求信息的风险意图大数据确定为与所述第一行为需求信息对应的第一风险意图大数据。
在一些可独立实施的设计思路下,所述方法还包括:如果所述第一服务会话中不存在分布与所述第一行为需求信息的分布信息匹配且携带所述第一行为需求信息的风险意图大数据,将所述第一行为需求信息在第一服务会话大数据中依照设定指示进行上采样操作,获得与所述第一行为需求信息对应的第一风险意图大数据,其中,所述第一服务会话大数据在所述第一服务会话中的分布配对于所述第一行为需求信息的分布信息。
在一些可独立实施的设计思路下,在所述基于所述第一行为需求信息和风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据之后,所述方法还包括:对所述至少一个目标风险意图大数据进行过滤,得到所述待分析用户行为事件的访问结果。
在一些可独立实施的设计思路下,所述对所述至少一个目标风险意图大数据进行过滤,得到所述待分析用户行为事件的访问结果,包括:基于所述至少一个目标风险意图大数据中每个目标风险意图大数据的显著性表达,将所述至少一个目标风险意图大数据拆解成至少一组风险意图大数据,每组风险意图大数据包括所述至少一个目标风险意图大数据中的至少一个风险意图大数据;基于所述至少一组风险意图大数据中每组风险意图大数据包括的风险意图大数据的显著性表达,确定所述每组风险意图大数据的过滤汇总结果;基于所述至少一组风险意图大数据中每组风险意图大数据的过滤汇总结果,将所述至少一组风险意图大数据中的一组或多组风险意图大数据中的风险意图大数据确定为所述访问结果。
在一些可独立实施的设计思路下,在所述通过所述待分析用户行为事件的业务互动大数据,访问行为需求信息集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息之前,所述方法还包括:对至少一个服务会话中的每个服务会话包括的服务会话大数据进行行为需求挖掘处理,得到多个行为需求信息;将所述多个行为需求信息以及所述多个行为需求信息中每个行为需求信息的信息添加到所述行为需求信息集,其中,所述行为需求信息的信息包括以下内容中的一种或多种:所述行为需求信息所绑定的服务会话信息、所述行为需求信息的分布信息、所述行为需求信息在服务会话大数据中的业务互动大数据描述信息。
在一些可独立实施的设计思路下,所述方法还包括:对所述多个行为需求信息进行行为需求持续性分析处理,得到至少一个行为需求视觉记录,其中,每个行为需求视觉记录包括所述多个行为需求信息中的至少两个行为需求信息;基于所述至少一个行为需求视觉记录中每个行为需求视觉记录包括的至少两个行为需求信息,确定所述每个行为需求视觉记录的去极性显著性表达;将所述至少一个行为需求视觉记录中每个行为需求视觉记录的去极性显著性表达添加到所述行为需求信息集。
在一些可独立实施的设计思路下,在所述基于所述第一行为需求信息和风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据之前,所述方法还包括:对至少一个服务会话中的每个服务会话进行风险意图挖掘处理,得到多个风险意图大数据;将所述多个风险意图大数据以及所述多个风险意图大数据中每个风险意图大数据的信息添加到所述风险意图数据集,其中,所述风险意图大数据的信息包括以下内容中的一种或多种:所述风险意图大数据所绑定的服务会话信息、所述风险意图大数据的分布信息、所述风险意图大数据在服务会话大数据中的业务互动大数据描述信息。
在一些可独立实施的设计思路下,所述方法还包括:对所述多个风险意图大数据进行风险意图持续性分析处理,得到至少一个风险意图视觉记录,其中,每个风险意图视觉记录包括所述多个风险意图大数据中的至少两个风险意图大数据;基于所述至少一个风险意图视觉记录中每个风险意图视觉记录包括的至少两个风险意图大数据,确定所述每个风险意图视觉记录的去极性显著性表达;将所述至少一个风险意图视觉记录中每个风险意图视觉记录的去极性显著性表达添加到所述行为需求信息集。
本申请实施例还提供了一种大数据防护服务器,包括处理器、通信总线和存储器;所述处理器和所述存储器通过所述通信总线通信,所述处理器从所述存储器中读取计算机程序并运行,以执行上述的方法。
本申请实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。
本申请实施例基于行为需求分析结合风险意图分析的综合解析方式,一方面根据行为需求信息集访问获得与待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息,另一方面根据风险意图数据集和第一行为需求信息采集与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据,这样可以尽可能减少风险意图挖掘分析的噪声比例,以提高针对待分析用户行为事件进行风险意图挖掘和分析的准确性和可靠性,此外,通过考虑行为需求和风险意图,能够实现风险意图挖掘分析的层次性以保障风险意图大数据的完整性,这样一来,在以目标风险意图大数据作为数据信息防护分析依据时,能够保障数据信息防护的可信度。
在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种大数据防护服务器的方框示意图。
图2为本申请实施例所提供的一种基于用户行为的大数据防护方法的流程图。
图3为本申请实施例所提供的一种基于用户行为的大数据防护装置的框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本申请的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
图1示出了本申请实施例所提供的一种大数据防护服务器10的方框示意图。本申请实施例中的大数据防护服务器10可以为具有数据存储、传输、处理功能的服务端,如图1所示,大数据防护服务器10包括:存储器11、处理器12、通信总线13和基于用户行为的大数据防护装置20。
存储器11、处理器12和通信总线13之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器11中存储有基于用户行为的大数据防护装置20,所述基于用户行为的大数据防护装置20包括至少一个可以软件或固件(firmware)的形式储存于所述存储器11中的软件功能模块,所述处理器12通过运行存储在存储器11内的软件程序以及模块,例如本申请实施例中的基于用户行为的大数据防护装置20,从而执行各种功能应用以及数据处理,即实现本申请实施例中的基于用户行为的大数据防护方法。
其中,所述存储器11可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器11用于存储程序,所述处理器12在接收到执行指令后,执行所述程序。
所述处理器12可能是一种集成电路芯片,具有数据的处理能力。上述的处理器12可以是通用处理器,包括中央处理器 (Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
通信总线13用于通过网络建立大数据防护服务器10与其他通信终端设备之间的通信连接,实现网络信号及数据的收发操作。上述网络信号可包括无线信号或者有线信号。
可以理解,图1所示的结构仅为示意,大数据防护服务器10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
本申请实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。
图2示出了本申请实施例所提供的一种基于用户行为的大数据防护的流程图。所述方法有关的流程所定义的方法步骤应用于大数据防护服务器10,可以由所述处理器12实现,所述方法包括以下内容。
步骤100、采集待分析用户行为事件的业务互动大数据。
本申请实施例中,待分析用户行为事件的业务互动大数据可以指包含有待分析用户行为事件的行为需求的业务互动大数据,可以包括行为需求的在线业务互动大数据或服务会话中包括行为需求的服务会话大数据。例如,待分析用户行为事件的业务互动大数据可以为服务会话大数据,可以是来自于业务用户互动终端的服务会话日志中的业务互动会话消息,也可以为独立的一条业务互动大数据或者一组业务互动大数据,还可以来自于另外的互动终端,本申请实施例对待分析用户行为事件的业务互动大数据的状态、传输方和获取方式等进一步实现不作限制。
示例性地,待分析用户行为事件可以是存在安全分析需求的行为事件,比如支付业务的身份验证事件和支付行为事件,又比如办公业务的文件传输事件,再比如智慧医疗业务的用户信息匿名处理行为事件等。此外,业务互动大数据可以包括多个维度的信息或者多个层面的信息,能够作为安全分析的原料,但是直接针对业务互动大数据进行数据安全分析,可能存在较大的噪声,因此需要进行后续的行为需求和风险意图挖掘和分析,从而提高数据信息安防处理和分析的精度和可信度。
步骤102、利用待分析用户行为事件的业务互动大数据,访问行为需求信息集,获得与待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息。
本申请实施例中,行为需求信息集可以是事先搭建的用于存储行为需求信息的关系型数据库(例如MySQL)。行为需求信息集中可以包含一个或多个用户行为事件的多个行为需求信息,每个用户行为事件可以对应一个或多个行为需求信息。
可以理解的是,该行为需求信息集中包括的行为需求信息可以是通过对一个或多个服务会话中的服务会话大数据进行行为需求挖掘处理得到的,或者,行为需求信息集包括的行为需求信息也可以是通过对在线业务互动大数据进行行为需求挖掘处理得到的,本申请实施例对行为需求信息集中包括的行为需求信息的提供方不作限定。
可以理解的是,该第一行为需求信息的个数可以为一个或多个,换言之,可以利用待分析用户行为事件的业务互动大数据访问行为需求信息集,获得与待分析用户行为事件的业务互动大数据存在关联关系的至少一个第一行为需求信息。
例如,行为需求信息集requirement_collection中包含有多个用户行为事件的行为需求信息,每个用户行为事件的行为需求信息可以为一个或多个,基于行为需求信息集requirement_collection访问与待分析用户行为事件的业务互动大数据ser_DATA存在关联关系的如下行为需求信息:第一行为需求信息req_information_1、req_information_2和req_information_3。其中,第一行为需求信息req_information_1、req_information_2和req_information_3为与待分析用户行为事件的业务互动大数据ser_DATA配对于同一个用户行为事件的行为需求信息。
示例性的,行为需求信息可以用于表征对应用户行为事件的互动需求或者交互需求,从而能够为后续的意图挖掘提供更为针对性的分析原料。
步骤104、根据第一行为需求信息和风险意图数据集,获得与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据。
本申请实施例中,风险意图数据集可以是事先搭建的用于记录风险意图大数据的关系型数据库。风险意图数据集中可以包含一个或多个用户行为事件的多个风险意图大数据,每个用户行为事件可以对应一个或多个风险意图大数据。
可以理解的是,风险意图数据集中包括的风险意图大数据可以是通过对一个或多个服务会话中的服务会话大数据进行风险意图挖掘处理得到的,其中,风险意图数据集中的风险意图大数据的服务会话提供方可以与行为需求信息集中的行为需求信息的服务会话提供方完全相同、部分相同或完全不同。亦或者,风险意图数据集中的风险意图大数据可以是通过对在线业务互动大数据进行风险意图挖掘处理得到的,本申请实施例对风险意图数据集中包括的风险意图大数据的提供方不作限定。
在上述内容的基础上,可以根据每个第一行为需求信息和风险意图数据集,得到至少一个目标风险意图大数据。该目标风险意图大数据可以是通过访问风险意图数据集得到的,但本申请实施例对此不作限定。
例如,风险意图数据集risk_intention_collection中可以包含有一个或多个用户行为事件的风险意图大数据,每个用户行为事件的风险意图大数据可以为多个,根据风险意图数据集risk_intention_collection和第一行为需求信息req_information_1可以采集与待分析用户行为事件的业务互动大数据ser_DATA存在关联关系的风险意图大数据risk_intention_DATA1和风险意图大数据risk_intention_DATA2,根据风险意图数据集risk_intention_collection和第一行为需求信息req_information_2可以采集与待分析用户行为事件的业务互动大数据ser_DATA存在关联关系的风险意图大数据risk_intention_DATA3,根据风险意图数据集risk_intention_collection和第一行为需求信息req_information_3可以采集与待分析用户行为事件的业务互动大数据ser_DATA存在关联关系的风险意图大数据risk_intention_DATA4和风险意图大数据risk_intention_DATA5。这样,可以获得与待分析用户行为事件的业务互动大数据存在关联关系的5个目标风险意图大数据risk_intention_DATA1-风险意图大数据risk_intention_DATA5。
本申请实施例中,上述步骤102可以认为是行为需求分析过程,步骤104可以认为是风险意图分析过程。此外,风险意图大数据可以包括各类存在异常的行为意图或者行为倾向,比如异常登录意图、异常互动意图、非常用地身份验证意图等,这些风险意图大数据可以作为大数据信息安防处理的依据,由于风险意图大数据精度高、针对性强,因而能够保障大数据信息安防检测和分析的精度和可信度,且由于风险意图大数据是经过简化处理的,在一定程度上还能够确保大数据信息安防检测和分析的效率,提高信息防护的时效性。
本申请实施例基于行为需求分析结合风险意图分析的综合解析方式,一方面根据行为需求信息集访问获得与待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息,另一方面根据风险意图数据集和第一行为需求信息采集与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据,既具有行为需求分析的时序持续性强、准确性高的优点,又具有风险意图分析的检测灵敏性高的优点,提高了针对待分析用户行为事件进行风险意图挖掘和分析的准确性和可靠性,此外,通过考虑行为需求和风险意图,能够实现风险意图挖掘分析的层次性以保障风险意图大数据的完整性,这样一来,在以目标风险意图大数据作为数据信息防护分析依据时,能够保障数据信息防护的可信度。
对于一些可独立实施的技术方案而言,以下为根据本申请实施例的基于用户行为的大数据防护方法另一实施方式。
步骤200、生成行为需求信息集和风险意图数据集。
本申请实施例中,行为需求信息集和风险意图数据集的生成过程可以互相隔离、互相不存在影响,可以同时实施或以随机顺序实施,本申请实施例对此不作限制。下面将分别介绍行为需求信息集和风险意图数据集的生成过程。
STEP1生成行为需求信息集
STEP1-1行为需求挖掘处理
可以对至少一个服务会话中的每个服务会话包括的服务会话大数据进行行为需求挖掘处理,得到多个行为需求信息,并将多个行为需求信息以及多个行为需求信息中每个行为需求信息的信息添加到行为需求信息集。
以一些示例性的角度来看待,行为需求信息的信息可以包括以下内容中的一种或多种:行为需求信息所绑定的服务会话信息、行为需求信息的分布信息(先后关系信息或者序号信息)、行为需求信息在服务会话大数据中的业务互动大数据描述信息(行为需求信息在服务会话大数据相对位置信息)等。
行为需求信息的分布信息可以指示行为需求信息所绑定的服务会话大数据,或者,行为需求信息所绑定的服务会话大数据也可以通过其他参量指示。可以理解的是,行为需求信息在服务会话大数据中的业务互动大数据描述信息可以指示行为需求信息在服务会话大数据中的描述,例如,行为需求信息在服务会话大数据中的业务互动大数据描述信息可以包括行为需求信息的约束标签描述信息(比如标识集的位置)。可以理解的是,行为需求信息的信息还可以包括其他信息,本申请实施例对此不作限定。
例如,可以将服务会话conversation_1进行拆解处理,得到两组服务会话大数据conversation_DATA1和conversation_DATA2。然后,可以对服务会话大数据conversation_DATA1和conversation_DATA2进行行为需求挖掘处理,从服务会话大数据conversation_DATA1中得到如下的行为需求信息,它们分别是:
行为需求信息conversation_req_information1;
行为需求信息conversation_req_information2,以及
行为需求信息conversation_req_information3。
从服务会话大数据conversation_DATA2中得到如下的行为需求信息,它们分别是:
行为需求信息conversation_req_information4,以及
行为需求信息conversation_req_information5。
在上述基础上,并采集各个行为需求信息的特征。其中,行为需求信息conversation_req_information1的特征包括:范例业务互动大数据conversation_DATA1的特征,如范例业务互动大数据conversation_DATA1的标签、序号、数据量、时序特征等,服务会话大数据conversation_DATA1的对应的分布distribution_1,行为需求信息conversation_req_information1在范例业务互动大数据conversation_DATA1中的描述信息,等等。
其中:
行为需求信息conversation_req_information2、
行为需求信息conversation_req_information3、
行为需求信息conversation_req_information4,以及
行为需求信息conversation_req_information5的特征与行为需求信息conversation_req_information1的特征类似,在此不再赘述。
在上述内容的基础上,可以将行为需求信息conversation_req_information1、
行为需求信息conversation_req_information2、
行为需求信息conversation_req_information3、
行为需求信息conversation_req_information4和行为需求信息conversation_req_information5及各自的特征添加到行为需求信息集requirement_collection。
STEP1-2行为需求持续性分析处理
对上述行为需求挖掘处理得到的多个行为需求信息进行行为需求持续性分析处理,得到至少一个行为需求视觉记录,其中,每个行为需求视觉记录涵盖若干行为需求信息中的至少两个行为需求信息。行为需求视觉记录包括的至少两个行为需求信息可以配对于同一用户行为事件。可以理解的是,可以将用于指示该多个行为需求信息与该至少一个行为需求视觉记录之间的对应关系的信息添加到行为需求信息集。作为一个可能的实施例,可以将该至少一个行为需求视觉记录中每个行为需求视觉记录的信息添加到行为需求信息集。可以理解的是,行为需求视觉记录的信息可以包括行为需求视觉记录包括的行为需求信息的标识信息。
可以理解的是,可以根据至少一个行为需求视觉记录中每个行为需求视觉记录包括的至少两个行为需求信息,确定每个行为需求视觉记录的去极性显著性表达,并将至少一个行为需求视觉记录中每个行为需求视觉记录的去极性显著性表达添加到行为需求信息集。
例如,可以对行为需求信息conversation_req_information1、
行为需求信息conversation_req_information2、
行为需求信息conversation_req_information3、
行为需求信息conversation_req_information4和行为需求信息conversation_req_information5进行行为需求持续性分析处理,得到行为需求视觉记录visual_record_1和visual_record_2。
其中,行为需求视觉记录visual_record_1包括行为需求信息conversation_req_information1、conversation_req_information3和行为需求信息conversation_req_information5,行为需求视觉记录visual_record_2包括行为需求信息conversation_req_information2和conversation_req_information4。
进一步地,在上述内容的基础上可以分别确定以下的行为需求信息conversation_req_information1、conversation_req_information3和行为需求信息conversation_req_information5的显著性表达,并将行为需求信息conversation_req_information1、conversation_req_information3和行为需求信息conversation_req_information5的显著性表达的去极性处理结果(平均化处理结果)作为行为需求视觉记录visual_record_1的去极性显著性表达characteristic_ave_1,分别确定行为需求信息conversation_req_information2和conversation_req_information4的显著性表达,并将行为需求信息conversation_req_information2和conversation_req_information4的显著性表达的去极性处理结果作为行为需求视觉记录visual_record_2的去极性显著性表达characteristic_ave_2。最后,将行为需求视觉记录visual_record_1的去极性显著性表达characteristic_ave_1和行为需求视觉记录visual_record_2的去极性显著性表达characteristic_ave_2添加到行为需求信息集requirement_collection。
可以理解的是,在上述例子中以行为需求视觉记录包括的多个行为需求信息的显著性表达的去极性处理结果作为行为需求视觉记录的去极性显著性表达,在本申请实施例中,行为需求视觉记录的去极性显著性表达可以是通过对行为需求视觉记录包括的至少两个行为需求信息的显著性表达进行处理得到的,本申请实施例对处理的进一步实现不作限定。
在另外的一些可能的示例中,可以将行为需求信息所绑定的行为需求视觉记录的信息作为行为需求信息的信息添加到行为需求信息集,例如行为需求信息的信息包括行为需求信息所绑定的行为需求视觉记录的标识信息和/或去极性显著性表达,本申请实施例对此不作限定。
可以理解的是,在生成行为需求信息集的过程中,可以采用AI智能模型等进行行为需求挖掘处理和行为需求持续性分析处理,本申请实施例对行为需求挖掘处理和行为需求持续性分析处理所采用的技术手段不作限制。
STEP2生成风险意图数据集
STEP2-1风险意图挖掘处理
对至少一个服务会话中的每个服务会话中的服务会话大数据进行风险意图挖掘处理,得到多个风险意图大数据,并将多个风险意图大数据以及多个风险意图大数据中每个风险意图大数据的信息添加到风险意图数据集。以一些示例性的角度来看待,风险意图大数据的信息可以包括以下内容中的一种或多种:风险意图大数据所绑定的服务会话信息、风险意图大数据的分布信息、风险意图大数据在服务会话大数据中的业务互动大数据描述信息。
风险意图大数据的分布信息可以指示风险意图大数据所绑定的服务会话大数据,或者,风险意图大数据所绑定的服务会话大数据也可以通过其他参量指示。可以理解的是,风险意图大数据在服务会话大数据中的业务互动大数据描述信息可以指示风险意图大数据在服务会话大数据中的描述,例如,风险意图大数据在服务会话大数据中的业务互动大数据描述信息可以包括风险意图大数据的约束标签描述信息。可以理解的是,风险意图大数据的信息还可以包括其他信息,本申请实施例对此不作限定。风险意图挖掘处理的实施方式可以参照上述行为需求挖掘处理的实施方式,在此不再赘述。
STEP2-2风险意图持续性分析处理
对多个风险意图大数据进行风险意图持续性分析处理,得到至少一个风险意图视觉记录,其中,每个风险意图视觉记录涵盖若干风险意图大数据中的至少两个风险意图大数据。风险意图视觉记录包括的至少两个风险意图大数据可以配对于同一用户行为事件。可以理解的是,可以将用于指示该多个风险意图大数据与该至少一个风险意图视觉记录之间的对应关系的信息添加到行为需求信息集。以一些示例性的角度来看待,可以将该至少一个风险意图视觉记录中每个风险意图视觉记录的信息添加到行为需求信息集。可以理解的是,风险意图视觉记录的信息可以包括风险意图视觉记录包括的风险意图大数据的标识信息。
可以理解的是,可以确定风险意图视觉记录中包括的至少两个风险意图大数据中每个风险意图大数据的显著性表达,并根据风险意图视觉记录包括的每个风险意图大数据的显著性表达,确定风险意图视觉记录的去极性显著性表达。其中,风险意图视觉记录的去极性显著性表达可以是通过对该风险意图视觉记录包括的至少两个风险意图大数据中每个风险意图大数据的显著性表达进行处理得到的,例如去极性处理处理,等等,本申请实施例对风险意图视觉记录的去极性显著性表达的进一步实现不做限定。
以一些示例性的角度来看待,可以根据至少一个风险意图视觉记录中每个风险意图视觉记录包括的至少两个风险意图大数据,确定每个风险意图视觉记录的去极性显著性表达,并将至少一个风险意图视觉记录中每个风险意图视觉记录的去极性显著性表达添加到行为需求信息集。
在另外的一些可能的示例中,可以将风险意图大数据所绑定的风险意图视觉记录的信息作为风险意图大数据的信息添加到行为需求信息集,例如风险意图大数据的信息包括风险意图大数据所绑定的风险意图视觉记录的标识信息和/或去极性显著性表达,本申请实施例对此不作限定。风险意图持续性分析处理的实施方式可以参照上述行为需求持续性分析处理的实施方式,在此不再赘述。
对于一种可独立实施的实施方式而言,对服务会话中的服务会话大数据进行行为需求/风险意图挖掘处理可以指利用行为需求/风险意图挖掘算法对服务会话中的每一条业务互动大数据进行分析,得到每一条业务互动大数据中的行为需求/风险意图数据集。对服务会话中的服务会话大数据进行行为需求/风险意图持续性分析处理可以指利用行为需求/风险意图持续性分析算法挖掘服务会话中配对于同一用户行为事件的行为需求/风险意图大数据,但本申请实施例对此不做限定。
步骤202、采集待分析用户行为事件的业务互动大数据。
步骤204、利用待分析用户行为事件的业务互动大数据,访问行为需求信息集,获得与待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息。
可以理解的是,步骤204可以包括如下步骤。
步骤2040、确定待分析用户行为事件的业务互动大数据的第一行为需求显著性表达。
本申请实施例中,将待分析用户行为事件的业务互动大数据的显著性表达(特征向量或者描述向量)称为第一行为需求显著性表达。可以理解的是,可以基于行为需求识别网络确定待分析用户行为事件的业务互动大数据的第一行为需求显著性表达,其中,行为需求识别网络用于确定行为需求显著性表达。
在一种可能的实施方式中,行为需求识别网络可以为AI智能模型。例如,基于行为需求识别网络采集待分析用户行为事件的业务互动大数据的第一行为需求显著性表达,第一行为需求显著性表达可以是多维向量,具体的维度与行为需求识别网络相关,第一行为需求显著性表达的每一位特征值的取值进行归一化处理,以保障每一位的取值的区间为[-1,1],但本申请实施例不限于此。
步骤2041、根据第一行为需求显著性表达,从行为需求信息集所包括的多个行为需求信息中确定第一行为需求信息。
以一些示例性的角度来看待,可以分别确定第一行为需求显著性表达与多个行为需求信息对应的多个第二行为需求显著性表达中每个第二行为需求显著性表达之间的差异分析结果(如欧式距离);将多个第二行为需求显著性表达中与第一行为需求显著性表达之间的差异分析结果最小或者差异分析结果不超过第一判定值的第二行为需求显著性表达所对应的至少一个行为需求信息确定为第一行为需求信息。
本申请实施例将行为需求信息集中的行为需求信息的显著性表达称为第二行为需求显著性表达。可以理解的是,多个行为需求信息中的每个行为需求信息可以配对于一个第二行为需求显著性表达,而该多个行为需求信息中的不同行为需求信息对应的第二行为需求显著性表达可以相同或不同。可以理解的是,该多个行为需求信息中配对于同一行为需求视觉记录的至少两个行为需求信息具有相同的第二行为需求显著性表达。例如,该至少两个行为需求信息的第二行为需求显著性表达可以为该至少两个行为需求信息所属行为需求视觉记录的去极性显著性表达,但本申请实施例不限于此。
行为需求信息conversation_req_information1、
行为需求信息conversation_req_information2、
行为需求信息conversation_req_information3、
行为需求信息conversation_req_information4和行为需求信息conversation_req_information5中的
行为需求信息conversation_req_information1、
conversation_req_information3和
行为需求信息conversation_req_information5
属于行为需求视觉记录visual_record_1。
行为需求信息conversation_req_information2
和conversation_req_information4不属于任何行为需求视觉记录,则行为需求信息conversation_req_information1对应的第二行为需求显著性表达、行为需求信息conversation_req_information3对应的第二行为需求显著性表达和行为需求信息conversation_req_information5对应的第二行为需求显著性表达均为行为需求视觉记录visual_record_1的去极性显著性表达characteristic_ave_1,行为需求信息conversation_req_information2的第二行为需求显著性表达可以为行为需求信息conversation_req_information2的显著性表达。
可以理解的是,可以将多个第二行为需求显著性表达中最小的第二行为需求显著性表达所对应的至少一个行为需求信息确定为第一行为需求信息,或者可以将多个第二行为需求显著性表达中不超过第一判定值的至少一个第二行为需求显著性表达所对应的至少一个行为需求信息确定为第一行为需求信息,其中,第一判定值可以根据不同的要求事先进行设定,本申请对其进一步实现不做限定。
步骤206、根据第一行为需求信息和风险意图数据集,获得与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据。
可以理解的是,步骤206可以包括如下步骤。
步骤2060、采集与第一行为需求信息对应的第一风险意图大数据。
本申请实施例中,可以从行为需求信息集中采集第一行为需求信息的特征,并根据采集的特征,确定与第一行为需求信息对应的第一风险意图大数据。可以理解的是,第一行为需求信息的特征可以包括第一行为需求信息所绑定的服务会话的特征和/或第一行为需求信息的分布特征,或者还可以进一步包括第一行为需求信息的业务互动大数据描述特征。以一些示例性的角度来看待,可以确定第一行为需求信息所绑定的第一服务会话以及第一行为需求信息的分布特征和业务互动大数据描述特征,并根据第一行为需求信息的分布特征和业务互动大数据描述特征,采集第一服务会话中与第一行为需求信息对应的第一风险意图大数据。
在一些可能的示例中,第一行为需求信息的分布特征可以指示第一行为需求信息在第一服务会话中所在的位置,可以根据第一行为需求信息的分布特征采集第一服务会话中包括第一行为需求信息的第一服务会话大数据,其中,第一服务会话大数据在第一服务会话中所绑定的位置配对于该第一行为需求信息的分布特征。第一行为需求信息的业务互动大数据描述特征可以指示第一行为需求信息在所绑定的服务会话大数据中的描述,例如,第一行为需求信息的约束标签在第一服务会话大数据中的相对位置特征,但本申请实施例不限于此。
可以理解的是,在采集第一风险意图大数据的过程中,具体可以依照如下两种方式实现。
第一种方式、如果第一服务会话中存在分布与第一行为需求信息的分布信息匹配且携带第一行为需求信息的风险意图大数据,将包含第一行为需求信息的风险意图大数据确定为与第一行为需求信息对应的第一风险意图大数据。
例如,第一行为需求信息req_information_1在第一服务会话service_1的第20组服务会话大数据中,在第一服务会话service_1的第20组服务会话大数据中存在完全包含第一行为需求信息req_information_1的风险意图大数据risk_intention_DATA1,则将风险意图大数据risk_intention_DATA1确定为与第一行为需求信息req_information_1对应的第一风险意图大数据。
第二种方式、若第一服务会话中不存在分布与第一行为需求信息的分布信息匹配且携带第一行为需求信息的风险意图大数据,将第一行为需求信息在第一服务会话大数据中依照设定指示进行上采样,获得与第一行为需求信息对应的第一风险意图大数据,其中,第一服务会话大数据在第一服务会话中的分布配对于第一行为需求信息的分布信息。
例如,第一行为需求信息req_information_2在第一服务会话service_2的第13组服务会话大数据中,在第一服务会话service_2的第13组服务会话大数据中不存在完全包含第一行为需求信息req_information_2的风险意图大数据,则可以将第一行为需求信息req_information_2在第一服务会话大数据即第13组服务会话大数据中依照设定指示进行上采样,并将上采样后的数据集确定为与第一行为需求信息req_information_2对应的第一风险意图大数据。
步骤2061、通过第一风险意图大数据访问风险意图数据集,获得与第一风险意图大数据存在关联关系的至少一个风险意图大数据。
本申请实施例中,可以理解的是,可以确定第一风险意图大数据的第一风险意图显著性表达,并根据第一风险意图显著性表达,从风险意图数据集所包括的多个风险意图大数据中确定与第一风险意图大数据存在关联关系的至少一个风险意图大数据。
本申请实施例将第一风险意图大数据的显著性表达称为第一风险意图显著性表达。可以理解的是,在从风险意图数据集所包括的多个风险意图大数据中确定与第一风险意图大数据存在关联关系的至少一个风险意图大数据时,可以确定第一风险意图显著性表达与多个风险意图大数据对应的多个第二风险意图显著性表达中每个第二风险意图显著性表达之间的差异分析结果,并将多个第二风险意图显著性表达中与第一风险意图显著性表达之间的差异分析结果最小或者不超过第二判定值的第二风险意图显著性表达所对应的至少一个风险意图大数据确定为与第一风险意图大数据存在关联关系的至少一个风险意图大数据。
可以理解的是,多个风险意图大数据中的每个风险意图大数据可以配对于一个第二风险意图显著性表达,而该多个风险意图大数据中的不同风险意图大数据对应的第二风险意图显著性表达可以相同或不同。可以理解的是,该多个风险意图大数据中配对于同一风险意图视觉记录的至少两个风险意图大数据具有相同的第二风险意图显著性表达。例如,该至少两个风险意图大数据的第二风险意图显著性表达可以为该至少两个风险意图大数据所属风险意图视觉记录的去极性显著性表达,但本申请实施例不限于此。
可以理解的是,可以将多个第二风险意图显著性表达中最小的第二风险意图显著性表达所对应的至少一个风险意图大数据确定为与第一风险意图大数据存在关联关系的风险意图大数据,或者可以将多个第二风险意图显著性表达中不超过第二判定值的至少一个第二风险意图显著性表达所对应的至少一个风险意图大数据确定为与第一风险意图大数据存在关联关系的风险意图大数据,其中,第二判定值可以根据不同的要求事先进行设定,本申请对其进一步实现不做限定。
以一些示例性的角度来看待,可以将与第一风险意图大数据存在关联关系的至少一个风险意图大数据确定为与待分析用户行为事件的业务互动大数据存在关联关系的目标风险意图大数据。
在另外的一些可能的示例中,步骤206还可以进一步包括:对与第一风险意图大数据存在关联关系的至少一个风险意图大数据进行过滤,获得与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据。
在另外的一些可能的示例中,在本申请实施例中,可以将与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据确定为待分析用户行为事件的访问结果。也可以首先确定与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据,然后对与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据进行过滤,得到待分析用户行为事件的访问结果,本申请实施例对此不做限定。
步骤208、对与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据进行过滤,得到待分析用户行为事件的访问结果。
可以理解的是,步骤208可以依照如下两种方式中的至少一种方式实现。
方式一、根据时序过滤指标和服务会话过滤指标中的至少一种对与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据进行过滤。
在一种可独立实施的实施方式中,可以根据实际情况调整过滤指标,例如,根据时序过滤指标(如从某一天的某个时段内)、服务会话过滤指标(如来自于哪个业务端)对待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据进行过滤。本申请实施例中,过滤指标包括但不限于时序过滤指标和服务会话过滤指标,还可以包括用户行为事件过滤指标,如事件类别、事件参与方的数目等等,本申请实施例对此不做限定。
方式二、对与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据的显著性表达对该至少一个目标风险意图大数据进行特征分析(聚类),并根据特征分析结果进行过滤。
可以理解的是,根据与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据中每个目标风险意图大数据的显著性表达,将至少一个目标风险意图大数据拆解成至少一组风险意图大数据,每组风险意图大数据可以包括至少一个风险意图大数据;根据该至少一组风险意图大数据中每组风险意图大数据包括的至少一个风险意图大数据的显著性表达,确定该每组风险意图大数据的过滤汇总结果;根据该至少一组风险意图大数据中每组风险意图大数据的过滤汇总结果,将该至少一组风险意图大数据中的一组或多组风险意图大数据包括的风险意图大数据确定为待分析用户行为事件的访问结果。
以一些示例性的角度来看待,一组风险意图大数据的过滤汇总结果可以包括该组风险意图大数据包括的至少一个风险意图大数据的显著性表达的去极性处理结果,但本申请实施例不限于此。
以一些示例性的角度来看待,可以根据每组风险意图大数据的过滤汇总结果,对至少一组风险意图大数据进行整理,并将排序在端点的一组或多组风险意图大数据剔除,得到待分析用户行为事件的访问结果。
对于一种可独立实施的实施方式而言,可以采用多均值聚类特征分析算法对与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据的显著性表达进行特征分析,得到多个分组的显著性表达,对于每个分组中的显著性表达,确定其对应的视觉记录的数目、显著性表达的偏移等过滤汇总结果,并根据过滤汇总结果确定哪些分组是干扰(如偏移最大的组为干扰组)。例如,假设与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据具体为200个风险意图视觉记录,每个风险意图视觉记录包括若干个风险意图大数据,则可以通过多均值聚类特征分析算法将200个风险意图视觉记录的显著性表达拆解为20个分组,具体地,可以对200个风险意图视觉记录的200个显著性表达进行多轮迭代多均值聚类特征分析运算,分成20个组,其中每组中包括的风险意图视觉记录的数目可以相同或不同,其中,第20组中只有10个风险意图视觉记录,且显著性表达的偏移最大,则可以确定第20组中的10个风险意图视觉记录为干扰,并从结果中去除第20组中的10个风险意图视觉记录中包括的风险意图大数据,剩余结果即为访问结果。
基于本申请实施例的上述介绍,本申请实施例的基于用户行为的大数据防护方法事先对大量的服务会话(如支付服务会话)进行服务会话优化操作(主要包括行为需求/风险意图挖掘处理和行为需求/风险意图持续性分析处理),生成行为需求信息集和风险意图数据集。在对包含行为需求的待分析用户行为事件的业务互动大数据进行访问时,一方面根据行为需求信息集进行行为需求分析,得到第一行为需求信息,另一方面根据风险意图数据集对第一行为需求信息进行风险意图分析,得到若干风险意图大数据,然后对若干风险意图大数据进行过滤处理,最终得到待分析用户行为事件的访问结果(该访问结果可以理解为针对于大数据防护的访问结果和定位结果)。
本申请实施例基于行为需求分析结合风险意图分析的综合解析方式,一方面根据行为需求信息集访问获得与待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息,另一方面根据风险意图数据集和第一行为需求信息采集与待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据。本申请实施例既具有行为需求分析的时序持续性强、准确性高的优点,又具有风险意图分析的检测灵敏性高的优点,提高了针对待分析用户行为事件进行风险意图挖掘和分析的准确性和可靠性,此外,通过考虑行为需求和风险意图,能够实现风险意图挖掘分析的层次性以保障风险意图大数据的完整性,这样一来,在以目标风险意图大数据作为数据信息防护分析依据时,能够保障数据信息防护的可信度。
对于一些可独立实施的技术方案而言,在获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据之后,该方法还可以包括以下内容:根据所述目标风险意图大数据对所述待分析用户行为事件进行大数据防护分析,得到大数据防护分析结果;基于所述大数据防护分析结果启用目标数据安防策略。
在本申请实施例中,可以通过大数据防护分析结果从预设的数据安防策略库中匹配对应的目标数据安防策略并启用,以实现对相关数据信息的防护处理,比如数据信息访问的权限验证处理,又比如指定访问对象的拦截处理,再比如相关重要信息的匿名化处理等,在此不作限定。可以理解的是,由于大数据防护分析结果是基于目标风险意图大数据得到的,因而能够确保大数据防护分析结果的针对性和可靠性。
对于一些可独立实施的技术方案而言,根据所述目标风险意图大数据对所述待分析用户行为事件进行大数据防护分析,得到大数据防护分析结果,可以包括以下步骤所描述的内容。
步骤300、根据所述目标风险意图大数据以及所述待分析用户行为事件的关联事件,确定待进行防护分析的事件特征簇,所述待进行防护分析的事件特征簇中包括多条待进行防护分析的事件特征。
在本申请实施例中,关联事件可以是与待分析用户行为事件存在时序关联或者场景关联的事件,事件特征可以是连续的特征轨迹。
步骤302、在根据所述待进行防护分析的事件特征簇进行威胁分析处理的过程中,在识别到第一待进行防护分析的事件特征中存在热度关键词的前提下,对所述第一待进行防护分析的事件特征再次进行事件特征调整,得到至少一条第二待进行防护分析的事件特征,所述第一待进行防护分析的事件特征包括位于所述大数据防护服务器的识别区间内的待进行防护分析的事件特征。
在本申请实施例中,热度关键词可以表征相关的特征信息处于使用状态,在这种情况下,需要跳过这类特征信息的威胁分析/防护分析,从而保障特征信息的正常使用。进一步地,大数据防护服务器的识别区间可以理解为大数据防护服务器的识别条件或者捕捉条件。
步骤304、根据所述第二待进行防护分析的事件特征对所述待进行防护分析的事件特征簇进行优化,得到优化后的待进行防护分析的事件特征簇;根据所述优化后的待进行防护分析的事件特征簇进行威胁分析处理,得到大数据防护分析结果。
可以理解的是,通过更新待进行防护分析的事件特征簇并进行威胁分析处理,能够在保障特征信息正常使用的前提下实现准确可靠的大数据防护分析。可以理解的是,热度关键词对应的特征信息通常是在先经过防护分析的,因而通过上述方式还能够在一定程度上节省大数据防护分析的资源开销。
对于一些可独立实施的技术方案而言,任一待进行防护分析的事件特征包括第一特征成员和第二特征成员,所述在识别到第一待进行防护分析的事件特征中存在热度关键词的前提下,对所述第一待进行防护分析的事件特征再次进行事件特征调整,得到至少一条第二待进行防护分析的事件特征,包括:在识别到所述第一待进行防护分析的事件特征中存在热度关键词的前提下,根据所述第一待进行防护分析的事件特征的第一特征成员和第二特征成员及所述热度关键词的分布情况,对所述第一待进行防护分析的事件特征再次进行事件特征调整,得到至少一条第二待进行防护分析的事件特征。
在本申请实施例中,特征成员可以是事件特征中的特征节点或者特征图谱单元,如此设计,通过对事件特征进行拆解处理分析,能够确保第二待进行防护分析的事件特征的准确可靠调整。
基于上述同样的发明构思,还提供了一种基于用户行为的大数据防护装置20,应用于大数据防护服务器10,所述装置包括:
数据采集模块21,用于采集待分析用户行为事件的业务互动大数据;
信息获得模块22,用于通过所述待分析用户行为事件的业务互动大数据,访问行为需求信息集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息,其中,所述行为需求信息集涵盖若干行为需求信息;
风险确定模块23,用于基于所述第一行为需求信息和风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据,其中,所述风险意图数据集涵盖若干风险意图大数据。
在本申请实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,大数据防护服务器10,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于用户行为的大数据防护方法,其特征在于,应用于大数据防护服务器,所述方法至少包括:
采集待分析用户行为事件的业务互动大数据;
通过所述待分析用户行为事件的业务互动大数据,访问行为需求信息集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息,其中,所述行为需求信息集涵盖若干行为需求信息;
基于所述第一行为需求信息和风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据,其中,所述风险意图数据集涵盖若干风险意图大数据。
2.如权利要求1所述的方法,其特征在于,所述通过所述待分析用户行为事件的业务互动大数据,访问行为需求信息集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息,包括:
确定所述待分析用户行为事件的业务互动大数据的第一行为需求显著性表达;
基于所述第一行为需求显著性表达,从所述行为需求信息集所包括的多个行为需求信息中确定所述第一行为需求信息。
3.如权利要求2所述的方法,其特征在于,所述基于所述第一行为需求显著性表达,从所述行为需求信息集所包括的多个行为需求信息中确定所述第一行为需求信息,包括:
确定所述第一行为需求显著性表达与所述多个行为需求信息对应的多个第二行为需求显著性表达中每个第二行为需求显著性表达之间的差异分析结果;
将所述多个第二行为需求显著性表达中与所述第一行为需求显著性表达之间的差异分析结果最小或者不超过第一判定值的第二行为需求显著性表达所对应的至少一个行为需求信息确定为所述第一行为需求信息。
4.如权利要求3所述的方法,其特征在于,所述多个行为需求信息中的至少两个行为需求信息组成配对于同一行为需求的行为需求视觉记录,所述至少两个行为需求信息对应的第二行为需求显著性表达为所述至少两个行为需求信息组成的行为需求视觉记录的去极性显著性表达。
5.如权利要求1所述的方法,其特征在于,所述基于所述第一行为需求信息和风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据,包括:
采集与所述第一行为需求信息对应的第一风险意图大数据;
通过所述第一风险意图大数据访问所述风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据;
其中,所述通过所述第一风险意图大数据访问所述风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据,包括:
确定所述第一风险意图大数据的第一风险意图显著性表达;
基于所述第一风险意图显著性表达,从所述风险意图数据集所包括的多个风险意图大数据中确定与所述第一风险意图大数据存在关联关系的至少一个风险意图大数据,以及将与所述第一风险意图大数据存在关联关系的至少一个风险意图大数据确定为所述目标风险意图大数据;
其中,所述基于所述第一风险意图显著性表达,从所述风险意图数据集所包括的多个风险意图大数据中确定与所述第一风险意图大数据存在关联关系的至少一个风险意图大数据,包括:
确定所述第一风险意图显著性表达与所述多个风险意图大数据对应的多个第二风险意图显著性表达中每个第二风险意图显著性表达之间的差异分析结果;
将所述多个第二风险意图显著性表达中与所述第一风险意图显著性表达之间的差异分析结果最小或者不超过第二判定值的第二风险意图显著性表达所对应的至少一个风险意图大数据确定为与所述第一风险意图大数据存在关联关系的至少一个风险意图大数据;
其中,所述多个风险意图大数据中的至少两个风险意图大数据组成配对于同一风险意图的风险意图视觉记录,所述至少两个风险意图大数据对应的第二风险意图显著性表达为所述至少两个风险意图大数据组成的风险意图视觉记录的去极性显著性表达。
6.如权利要求5所述的方法,其特征在于,所述采集与所述第一行为需求信息对应的第一风险意图大数据,包括:
确定所述第一行为需求信息所绑定的第一服务会话以及所述第一行为需求信息的分布信息和业务互动大数据描述信息;
基于所述第一行为需求信息的分布信息和业务互动大数据描述信息,采集所述第一服务会话中与所述第一行为需求信息对应的第一风险意图大数据;
其中,所述基于所述第一行为需求信息的分布信息和业务互动大数据描述信息,采集所述第一服务会话中与所述第一行为需求信息对应的第一风险意图大数据,包括:
如果所述第一服务会话中存在分布与所述第一行为需求信息的分布信息匹配且携带所述第一行为需求信息的风险意图大数据,将所述携带所述第一行为需求信息的风险意图大数据确定为与所述第一行为需求信息对应的第一风险意图大数据;
其中,所述方法还包括:
如果所述第一服务会话中不存在分布与所述第一行为需求信息的分布信息匹配且携带所述第一行为需求信息的风险意图大数据,将所述第一行为需求信息在第一服务会话大数据中依照设定指示进行上采样操作,获得与所述第一行为需求信息对应的第一风险意图大数据,其中,所述第一服务会话大数据在所述第一服务会话中的分布配对于所述第一行为需求信息的分布信息。
7.如权利要求1所述的方法,其特征在于,在所述基于所述第一行为需求信息和风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据之后,所述方法还包括:
对所述至少一个目标风险意图大数据进行过滤,得到所述待分析用户行为事件的访问结果;
其中,所述对所述至少一个目标风险意图大数据进行过滤,得到所述待分析用户行为事件的访问结果,包括:
基于所述至少一个目标风险意图大数据中每个目标风险意图大数据的显著性表达,将所述至少一个目标风险意图大数据拆解成至少一组风险意图大数据,每组风险意图大数据包括所述至少一个目标风险意图大数据中的至少一个风险意图大数据;
基于所述至少一组风险意图大数据中每组风险意图大数据包括的风险意图大数据的显著性表达,确定所述每组风险意图大数据的过滤汇总结果;
基于所述至少一组风险意图大数据中每组风险意图大数据的过滤汇总结果,将所述至少一组风险意图大数据中的一组或多组风险意图大数据中的风险意图大数据确定为所述访问结果。
8.如权利要求1所述的方法,其特征在于,在所述通过所述待分析用户行为事件的业务互动大数据,访问行为需求信息集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的第一行为需求信息之前,所述方法还包括:
对至少一个服务会话中的每个服务会话包括的服务会话大数据进行行为需求挖掘处理,得到多个行为需求信息;
将所述多个行为需求信息以及所述多个行为需求信息中每个行为需求信息的信息添加到所述行为需求信息集,其中,所述行为需求信息的信息包括以下内容中的一种或多种:
所述行为需求信息所绑定的服务会话信息、所述行为需求信息的分布信息、所述行为需求信息在服务会话大数据中的业务互动大数据描述信息;
其中,所述方法还包括:
对所述多个行为需求信息进行行为需求持续性分析处理,得到至少一个行为需求视觉记录,其中,每个行为需求视觉记录包括所述多个行为需求信息中的至少两个行为需求信息;
基于所述至少一个行为需求视觉记录中每个行为需求视觉记录包括的至少两个行为需求信息,确定所述每个行为需求视觉记录的去极性显著性表达;
将所述至少一个行为需求视觉记录中每个行为需求视觉记录的去极性显著性表达添加到所述行为需求信息集。
9.如权利要求1所述的方法,其特征在于,在所述基于所述第一行为需求信息和风险意图数据集,获得与所述待分析用户行为事件的业务互动大数据存在关联关系的至少一个目标风险意图大数据之前,所述方法还包括:
对至少一个服务会话中的每个服务会话进行风险意图挖掘处理,得到多个风险意图大数据;
将所述多个风险意图大数据以及所述多个风险意图大数据中每个风险意图大数据的信息添加到所述风险意图数据集,其中,所述风险意图大数据的信息包括以下内容中的一种或多种:
所述风险意图大数据所绑定的服务会话信息、所述风险意图大数据的分布信息、所述风险意图大数据在服务会话大数据中的业务互动大数据描述信息;
其中,所述方法还包括:
对所述多个风险意图大数据进行风险意图持续性分析处理,得到至少一个风险意图视觉记录,其中,每个风险意图视觉记录包括所述多个风险意图大数据中的至少两个风险意图大数据;
基于所述至少一个风险意图视觉记录中每个风险意图视觉记录包括的至少两个风险意图大数据,确定所述每个风险意图视觉记录的去极性显著性表达;
将所述至少一个风险意图视觉记录中每个风险意图视觉记录的去极性显著性表达添加到所述行为需求信息集。
10.一种大数据防护服务器,其特征在于,包括处理器、通信总线和存储器;所述处理器和所述存储器通过所述通信总线通信,所述处理器从所述存储器中读取计算机程序并运行,以执行权利要求1-9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111217359.0A CN113821815A (zh) | 2021-10-19 | 2021-10-19 | 一种基于用户行为的大数据防护方法及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111217359.0A CN113821815A (zh) | 2021-10-19 | 2021-10-19 | 一种基于用户行为的大数据防护方法及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113821815A true CN113821815A (zh) | 2021-12-21 |
Family
ID=78917035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111217359.0A Withdrawn CN113821815A (zh) | 2021-10-19 | 2021-10-19 | 一种基于用户行为的大数据防护方法及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113821815A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114490302A (zh) * | 2022-03-04 | 2022-05-13 | 大庆火兔网络科技有限公司 | 一种基于大数据分析的威胁行为分析方法及服务器 |
CN115168917A (zh) * | 2022-07-07 | 2022-10-11 | 青岛安泰德科技有限公司 | 一种云计算服务的异常用户行为处理方法及服务器 |
CN116720181A (zh) * | 2023-05-06 | 2023-09-08 | 武汉优尼思科技有限公司 | 应对智慧数字服务的可视化操作风险预测方法及软件产品 |
-
2021
- 2021-10-19 CN CN202111217359.0A patent/CN113821815A/zh not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114490302A (zh) * | 2022-03-04 | 2022-05-13 | 大庆火兔网络科技有限公司 | 一种基于大数据分析的威胁行为分析方法及服务器 |
CN114490302B (zh) * | 2022-03-04 | 2023-04-11 | 深圳市众成信息技术有限公司 | 一种基于大数据分析的威胁行为分析方法及服务器 |
CN115168917A (zh) * | 2022-07-07 | 2022-10-11 | 青岛安泰德科技有限公司 | 一种云计算服务的异常用户行为处理方法及服务器 |
CN115168917B (zh) * | 2022-07-07 | 2023-09-22 | 大唐智创(山东)科技有限公司 | 一种云计算服务的异常用户行为处理方法及服务器 |
CN116720181A (zh) * | 2023-05-06 | 2023-09-08 | 武汉优尼思科技有限公司 | 应对智慧数字服务的可视化操作风险预测方法及软件产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113821815A (zh) | 一种基于用户行为的大数据防护方法及服务器 | |
CN110177108B (zh) | 一种异常行为检测方法、装置及验证系统 | |
CN113706177B (zh) | 一种基于大数据安防的威胁识别方法及数据安防服务器 | |
US7555482B2 (en) | Automatic detection of abnormal data access activities | |
CN113949577A (zh) | 一种应用于云服务的数据攻击分析方法及服务器 | |
CN112182519A (zh) | 一种计算机存储系统安全访问方法及访问系统 | |
CN113706176B (zh) | 一种结合云计算的信息反欺诈处理方法及服务平台系统 | |
CN104090835B (zh) | 基于eID和谱理论的跨平台虚拟资产交易审计方法 | |
CN113132311B (zh) | 异常访问检测方法、装置和设备 | |
CN114297448B (zh) | 基于智慧防疫大数据识别的证照申办方法、系统及介质 | |
CN108268886B (zh) | 用于识别外挂操作的方法及系统 | |
CN112115468B (zh) | 基于大数据和云计算的业务信息检测方法及云计算中心 | |
CN115422592A (zh) | 大数据安防处理方法及系统 | |
CN114154995B (zh) | 一种应用于大数据风控的异常支付数据分析方法及系统 | |
CN113918621A (zh) | 一种基于互联网金融的大数据防护处理方法及服务器 | |
CN114154990B (zh) | 一种基于在线支付的大数据防攻击方法及存储介质 | |
CN113486983A (zh) | 一种用于反欺诈处理的大数据办公信息分析方法及系统 | |
CN115086060A (zh) | 一种流量检测方法、装置、设备及可读存储介质 | |
CN113806343B (zh) | 一种车联网数据质量的评估方法和系统 | |
CN116319815B (zh) | 引入SaaS特征的云数据放置策略管理系统 | |
CN112583847A (zh) | 一种面向中小企业网络安全事件复杂分析的方法 | |
CN113946819A (zh) | 一种基于云计算的在线支付信息入侵检测方法及服务器 | |
CN114817518A (zh) | 基于大数据档案识别的证照办理方法、系统及介质 | |
CN113312671A (zh) | 应用于大数据挖掘的数字化业务操作安全处理方法及系统 | |
CN107748705A (zh) | 系统evt日志碎片恢复的方法、终端设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20211221 |