CN112733045B - 用户行为的分析方法、装置及电子设备 - Google Patents
用户行为的分析方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112733045B CN112733045B CN202110365553.7A CN202110365553A CN112733045B CN 112733045 B CN112733045 B CN 112733045B CN 202110365553 A CN202110365553 A CN 202110365553A CN 112733045 B CN112733045 B CN 112733045B
- Authority
- CN
- China
- Prior art keywords
- user
- user behavior
- behavior analysis
- data access
- access sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 370
- 230000006399 behavior Effects 0.000 claims abstract description 511
- 238000000034 method Methods 0.000 claims abstract description 289
- 238000012549 training Methods 0.000 claims abstract description 105
- 238000012216 screening Methods 0.000 claims description 54
- 230000008569 process Effects 0.000 claims description 27
- 230000015654 memory Effects 0.000 claims description 9
- 238000007405 data analysis Methods 0.000 abstract description 6
- 238000012545 processing Methods 0.000 description 11
- 230000002159 abnormal effect Effects 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 10
- 230000004913 activation Effects 0.000 description 9
- 230000003213 activating effect Effects 0.000 description 5
- 238000013480 data collection Methods 0.000 description 4
- 206010000117 Abnormal behaviour Diseases 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005242 forging Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001680 brushing effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0257—User requested
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种用户行为的分析方法、装置及电子设备,用户行为分析模型预先通过训练样本训练得到,所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本,则使用该用户行为分析模型对用户行为分析时,相比于黑名单的方式,用户行为分析准确度高。进一步,本发明中,数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型,在对用户行为进行分析时,不同的数据访问子流程调用其对应的用户行为分析模型进行用户行为分析,数据分析准确度高,进而提高用户行为分析准确度。
Description
技术领域
本发明涉及用户行为分析领域,更具体的说,涉及一种用户行为的分析方法、装置及电子设备。
背景技术
随着互联网行业的不断发展,界面显示越来越丰富。一般在页面的一些区域,如右下角,会弹出广告界面,用户能够通过点击该广告的方式来实现广告的访问。
在实际应用中,通过对访问广告的用户的用户行为进行分析,来避免针对广告的恶意访问行为的发生。具体地,在用户通过用户设备访问广告时,采集用户设备的IP(网际互连协议,Internet Protocol)地址,判断该IP地址是否在黑名单中,若在,则认为是恶意访问行为,禁止此次广告访问行为。
但是上述这种通过黑名单方式来对用户行为进行分析的方式,用户行为分析准确度较低,进而使得基于分析结果进行广告访问控制的准确度较低。
发明内容
有鉴于此,本发明提供一种用户行为的分析方法、装置及电子设备,以解决通过黑名单方式来对用户行为进行分析的方式,用户行为分析准确度较低,进而使得基于分析结果进行广告访问控制的准确度较低的问题。
为解决上述技术问题,本发明采用了如下技术方案:
一种用户行为的分析方法,应用于处理器,所述处理器中预先设置的数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型;
所述用户行为的分析方法包括:
获取待分析数据,所述待分析数据包括:满足预设用户设定规则的目标用户在当前数据访问子流程中生成的当前用户行为数据;所述预设用户设定规则为:用户在上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果满足预设分析结果筛选规则;
获取与所述当前数据访问子流程对应的用户行为分析模型;所述用户行为分析模型基于训练样本训练得到;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本;
调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果。
可选地,所述待分析数据还包括:参考用户行为分析结果;所述参考用户行为分析结果为在所述上一数据访问子流程中所述目标用户对应的用户行为分析结果;
所述用户行为分析模型的训练样本还包括:所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本。
可选地,所述调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果,包括:
获取与所述当前数据访问子流程对应的预设黑名单;
判断所述预设黑名单中是否包括所述当前用户行为数据,得到判断结果;
参照预设筛选规则,从所述判断结果中筛选出目标判断结果,确定所述目标判断结果对应的目标用户,并作为待处理用户;
使用所述用户行为分析模型对所述待处理用户的当前用户行为数据以及参考用户行为分析结果进行分析,得到所述待处理用户在所述当前数据访问子流程中的用户行为分析结果。
可选地,在所述调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果之后,还包括:
获取所述目标用户在所述上一数据访问子流程中的上一用户行为数据,以及所述目标用户在所述上一数据访问子流程之前的上一数据访问子流程中的用户行为分析结果;
将所述目标用户在所述当前数据访问子流程中的用户行为分析结果,确定为所述目标用户在所述上一数据访问子流程中的校正后的用户行为分析结果;
使用所述目标用户在所述上一数据访问子流程中的上一用户行为数据,以及所述目标用户在所述上一数据访问子流程之前的上一数据访问子流程中的用户行为分析结果、以及所述校正后的用户行为分析结果,对所述上一数据访问子流程对应的用户行为分析模型进行训练,直至满足预设停止训练条件时停止。
可选地,所述获取待分析数据包括:
筛选出上一数据访问子流程对应的用户行为分析结果为第一预设用户行为分析结果的用户,作为目标用户并添加到目标用户集合中;
筛选出上一数据访问子流程对应的用户行为分析结果为第二预设用户行为分析结果的非目标用户;
从所述非目标用户中,筛选出指定数量的非目标用户;
将所述筛选出的指定数量的非目标用户作为新的目标用户,并添加到所述目标用户集合中;
获取所述目标用户集合中的各个目标用户在当前数据访问子流程中生成的当前用户行为数据。
可选地,所述用户行为分析模型的生成过程包括:
获取训练样本;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本、所述用户的用户行为分析结果样本以及所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本;
使用所述训练样本对用户行为分析模型进行训练,直至满足预设停止训练条件时停止。
一种用户行为的分析装置,应用于处理器,所述处理器中预先设置的数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型;
所述用户行为的分析装置包括:
数据获取模块,用于获取待分析数据,所述待分析数据包括:满足预设用户设定规则的目标用户在当前数据访问子流程中生成的当前用户行为数据;所述预设用户设定规则为:用户在上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果满足预设分析结果筛选规则;
模型获取模块,用于获取与所述当前数据访问子流程对应的用户行为分析模型;所述用户行为分析模型基于训练样本训练得到;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本;
行为分析模块,用于调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果。
可选地,所述待分析数据还包括:参考用户行为分析结果;所述参考用户行为分析结果为在所述上一数据访问子流程中所述目标用户对应的用户行为分析结果;
所述用户行为分析模型的训练样本还包括:所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本。
可选地,所述行为分析模块包括:
名单获取子模块,用于获取与所述当前数据访问子流程对应的预设黑名单;
判断子模块,用于判断所述预设黑名单中是否包括所述当前用户行为数据,得到判断结果;
筛选子模块,用于参照预设筛选规则,从所述判断结果中筛选出目标判断结果,确定所述目标判断结果对应的目标用户,并作为待处理用户;
行为分析子模块,用于使用所述用户行为分析模型对所述待处理用户的当前用户行为数据以及参考用户行为分析结果进行分析,得到所述待处理用户在所述当前数据访问子流程中的用户行为分析结果。
一种电子设备,包括:存储器和处理器;所述存储器中预先设置的数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型;
其中,所述存储器用于存储程序;
处理器调用程序并用于:
获取待分析数据,所述待分析数据包括:满足预设用户设定规则的目标用户在当前数据访问子流程中生成的当前用户行为数据;所述预设用户设定规则为:用户在上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果满足预设分析结果筛选规则;
获取与所述当前数据访问子流程对应的用户行为分析模型;所述用户行为分析模型基于训练样本训练得到;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本;
调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果。
相较于现有技术,本发明具有以下有益效果:
本发明提供了一种用户行为的分析方法、装置及电子设备,用户行为分析模型预先通过训练样本训练得到,所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本,则使用该用户行为分析模型对用户行为分析时,相比于黑名单的方式,用户行为分析准确度高。进一步,本发明中,数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型,在对用户行为进行分析时,不同的数据访问子流程调用其对应的用户行为分析模型进行用户行为分析,数据分析准确度高,进而提高用户行为分析准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种数据访问子流程的场景示意图;
图2为本发明实施例提供的一种用户行为的分析方法的方法流程图;
图3为本发明实施例提供的另一种用户行为的分析方法的方法流程图;
图4为本发明实施例提供的又一种用户行为的分析方法的方法流程图;
图5为本发明实施例提供的再一种用户行为的分析方法的方法流程图;
图6为本发明实施例提供的一种用户行为的分析方法的场景示意图;
图7为本发明实施例提供的一种用户行为的分析装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着互联网用户覆盖率的不断提高,用户增速放缓,人口红利和流量红利逐渐消失,互联网企业对流量的抢夺越来越激烈。
为了获取更多的用户,企业需要花费巨大的投放预算来实现快速的用户增长。然而在投放的过程中,很多渠道商经常伪造虚假用户,获取额外的收益。对于广告投放企业而言,虚假用户意味着投放预算的浪费,给企业也带来了很大的经济损失,也会使企业错过最佳的推广时机,因此注重渠道的质量监控的精细化投放成为企业的必然选择。
而在广告投放中,可以采取多种不同的结算方式,典型的有:CPM(Cost PerMille,千人展现成本)、CPC(Cost Per Click,点击成本)、CPA(Cost Per Action,每行动成本)、CPS(Cost Per Sales,每笔销售成本)等。不同结算方式对应的作弊方式并不相同,一般来说作弊方式有流量劫持、机器刷量、任务分发(比如积分墙、微信墙、夺宝、社群自组织如羊毛党、造假村等)等多种方式。
为了应对上述的作弊方式,广告投放商也研究出了对应的反作弊方式,可以安装对应的反作弊工具,该工具可以设置有异常IP(Internet Protocol,网际互连协议)地址黑名单库,异常IP地址黑名单库中存储有异常IP地址,若用户在进行广告访问时,用户使用的IP地址存在于上述的异常IP地址黑名单库时,则认为此次访问为作弊行为,禁止此次访问行为。
但是随着技术的升级,为了防止异常IP地址黑名单库对用户访问行为的禁止,作弊技术不断更新,如可以利用公共IP池、伪造IP地址的方式,这样可以避免此次IP地址被识别为黑名单。也就是说,仅通过设置异常IP地址黑名单库的方式,用户行为分析的准确度较低,并不能够准确的识别出用户的作弊行为。
此外,还可以利用收集并检测安装常用的作弊工具和检测ROOT越狱权限、分析具体业务数据的方式,实现用户行为的分析,但是针对这种方式,可以通过屏蔽程序列表、让作弊工具检测不到安装的软件,伪造业务数据的方式,来提高作弊手段,也使得用户行为分析的准确度较低,进而不能够准确的识别出用户的作弊行为。
为了解决上述的用户行为分析的准确度较低的技术问题,发明人经过研究发现,模型,如机器学习模型能够使用大量的训练数据训练得到,数据处理准确度较高,进而能够使用机器学习模型来对用户行为进行分析,提高用户行为分析的准确度。
进一步地,在广告访问过程中,一般可以分成多个子流程,可以针对每一子流程构建对应的机器学习模型,这样,机器学习模型在训练时,只需要使用子流程的用户行为数据进行训练,能够更加精准的识别出该子流程中的用户行为分析结果。相比于在整个数据访问流程中,采集各个子流程的数据,统一输入到同一机器学习模型的方式,数据分析细粒度更小,进而能够更加精准地识别出每一子流程的用户行为。
在上述内容的基础上,本发明实施例提供了一种用户行为的分析方法,该方法可以应用于处理器,本实施例中的处理器可以是各个广告投放商的处理器,也可以是投放各个链接的服务商的处理器,如投放有奖竞猜、投票的链接,也就是说,本发明的应用场景不仅包括广告场景,还可以包括其他链接投放场景。
所述处理器中预先设置的数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型。
参照图1,根据对各种业务流程的分析,可以将整个业务流程,本实施例中的称为数据访问流程,抽象成下述五个数据访问子流程:
曝光—>点击/启动—>浏览—>注册激活—>业务目标。
其中,曝光环节主要由媒体方或渠道方控制,数据采集较为困难,本实施例中,不对曝光环节的用户行为进行分析。后续的点击/启动、浏览、注册激活和业务目标这几个数据访问子流程可以进行用户行为分析。
具体地,从点击/启动这一步骤开始,用户行为数据(如设备环境相关信息、用户行为序列、用户UserID(使用者辩证码)及关系信息以及业务转化数据等均可以通过相关技术获取,在实际应用中,可以将用户行为识别点绑定到业务关键节点(可以是上述的每一数据访问子流程的结束点),在每一个子流程中,获取相关的数据,并对用户行为进行分析。
本发明的另一实现方式中,对上述的点击/启动、浏览、注册激活和业务目标这几个数据访问子流程,使用数据采集子系统采集用户行为数据的过程进行介绍。
在点击/启动这一子流程中,可以通过数据采集子系统进行数据采集。数据采集子系统通过前端埋点(js和sdk)和后端采集的方式,采集用户设备环境相关信息,包括但不限于用户设备ID(Identity document,身份标识号),IMEI(International MobileEquipment Identity,国际移动设备识别码),MAC(Media Access Control Address)地址、设备厂商、屏幕分辨率、设备制造商、设备型号、操作系统、操作系统版本、应用程序APP版本、浏览器、浏览器版本、运营商、网络环境、IP地址、所在省份和城市等相关数据。
在浏览这一子流程中,数据采集子系统可以采用用户行为数据,如用户点击、浏览、输入等数据,包括但不限于事件名、全局设备唯一标识、浏览时间、最近访问来源、最近访问来源域名、最近的流量来源类型、最近搜索的关键词、最近一个渠道号、各业务名称、页面id、上个URL(uniform resource locator,统一资源定位系统)、当前URL、页面标题、是否第一天访问、是否第一次访问。
在注册激活这一子流程中,数据采集子系统采集用户UserID及关系信息,具体地,可以为用户注册的用户名、用户所属的团队(如哪一公司)、联系人信息,渠道号、元素指向的URL、推荐人id、推荐人姓名,推荐人所属团队、投放渠道、平台等信息。
在业务目标这一子流程中,数据采集子系统采集业务转化数据,主要用户下单支付到投保,在此过程中采集包括但不限于如办理的产品ID、订单号,支付渠道、投保人姓名、投保人身份证号、被保人姓名,被保人身份证号,投被保人关系、投保产品类型,投保公司等。
需要说明的是,在用户执行到注册激活这一子流程之前,主要是通过用户的设备ID来识别用户,在用户执行到注册激活这一子流程之后,主要是通过用户UserID来识别用户,在用户注册激活之后,对于同一用户,需要建立用户UserID与设备ID的映射关系,以能够在不同的子流程中,识别出同一用户。
另外,不同的子流程之间,数据采集子系统采集的数据可以是有重复的,比如,在业务目标这一子流程、以及注册激活这一子流程都会采集IP地址,上述采集的数据,重点描述了各个子流程所需采集的特有的数据,对于子流程均使用的数据,未重点描述。
在确定了上述的各个数据访问子流程之后,还需要构建每一数据访问子流程对应的用户行为分析模型,不同的数据访问子流程对应有不同的用户行为分析模型。
在实际应用中,用户行为分析模型可以是同一机器学习模型,但是由于训练数据的不同,最终得到的机器学习模型也不同。
此外,还可以针对不同的数据访问子流程,分析其数据特征,来选择相适用的模型。本发明实施例支持多算法多模型的机器学习子系统,不同子流程采取的模型算法不同,互相兼容,且需要为后期算法迭代和系统升级预留扩展空间。具体地,对于点击/启动这一子流程,可以使用决策树算法模型,对于浏览这一子流程,可以使用LSTM(Long Short-TermMemory,长短期记忆网络)算法模型,对于注册激活这一子流程,可以使用K-means聚类以及用户关系图算法模型,对于业务目标这一子流程,可以使用逻辑回归模型。
需要说明的是,本实施例中的各个模型均是通过离线数据训练和验证后,再上线使用的。
在实际应用中,对于决策树算法模型,其内部处理逻辑为:
根据收集到的训练数据,形成设备、系统相关数据,对于新的设备与标准设备进行匹配,判断用户操作系统、设备机型等是否吻合,进而判断是否有设备修改或者模拟器伪装、篡改UA等设备信息,得到用户行为分析结果。
对于LSTM算法模型,其内部处理逻辑为:
对用户的点击行为、浏览行为、输入行为以及其他事件进行行为检测,对于不符合正常用户浏览路径、存在行为间隔太短、行为频次异常以及不同画像用户的跳转率以及功能使用率异常均纳入特征进行行为识别,得到用户行为分析结果。
对于逻辑回归模型,其内部处理逻辑为:
对用户性别、身份证地址,年龄、手机号与IP地址归属省份是否一致、注册到首次下单时间间隔、用户注册来源、用户注册前访问次数、用户累计投保单数以及用户与投保人关系数等,进行逻辑回归,得到用户行为分析结果。
对于K-means聚类以及用户关系图算法模型,其内部处理逻辑为:
对于同一IP多用户聚集,同一设备多用户聚集以及用户所在地域集中度高、同一无线通信技术wifi环境、同一手机号段、身份证号相似度极高以及用户画像相似等特征进行人群聚类,以及通过链接分享以及打开、已建立的好友关系链以及异常孤立点用户进行作弊识别,得到用户行为分析结果。
在上述内容的基础上,参照图2,用户行为的分析方法可以包括:
S11、获取待分析数据。
所述待分析数据包括:满足预设用户设定规则的目标用户在当前数据访问子流程中生成的当前用户行为数据;所述预设用户设定规则为:用户在上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果满足预设分析结果筛选规则。
在实际应用中,用户首先需要从曝光子流程开始执行,然后依次是点击/启动、浏览、注册激活和业务目标这几个子流程。
对于上述的点击/启动、浏览、注册激活和业务目标这几个子流程,用户执行到哪一子流程时,哪一子流程就作为当前数据访问子流程,该子流程的上一子流程即为上一数据访问子流程。举例来说,假设用户当前访问注册激活这一子流程,上一数据访问子流程即为浏览。
在当前数据访问子流程中,通过用户操作,可以生成当前用户行为数据,具体的用户行为数据的内容,可以参照上述实施例中的相应说明。
在实际应用中,仅对目标用户的用户行为进行分析,其中,目标用户需要满足预设用户设定规则,预设用户设定规则为:用户在上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果满足预设分析结果筛选规则。
在实际应用中,参照图3,确定目标用户的过程可以包括:
S21、筛选出上一数据访问子流程对应的用户行为分析结果为第一预设用户行为分析结果的用户,作为目标用户并添加到目标用户集合中。
在实际应用中,上述的各个子流程是顺序执行的,执行完一子流程之后,可以得到用户行为分析结果,该用户是否可以执行下一子流程,是由该用户行为分析结果决定的。本实施例中,预先设定了用户行为分析结果,主要包括两种,一种是正常用户,一种是恶意用户。
对于当前数据访问子流程,若是上一数据访问子流程对应的用户行为分析结果为第一预设用户行为分析结果,如,正常用户,则说明该用户有很大可能不是恶意行为访问的用户,此时允许该用户执行当前的数据访问子流程所以,本实施例中,需要筛选出上一数据访问子流程对应的用户行为分析结果为第一预设用户行为分析结果的用户,这些用户是允许执行当前数据访问子流程的,则将该用户作为目标用户,并添加到目标用户集合中。
S22、筛选出上一数据访问子流程对应的用户行为分析结果为第二预设用户行为分析结果的非目标用户。
若是上一数据访问子流程对应的用户行为分析结果为第二预设用户行为分析结果,如,恶意用户,则说明通过上一数据访问子流程的分析,该用户有很大概率为恶意访问行为的用户,若此时直接禁止该用户访问当前数据访问子流程,也可能存在恶意用户识别错误而导致正常用户无法访问的情况,所以,为了避免此次情况的出现,可以允许上一数据访问子流程对应的用户行为分析结果为第二预设用户行为分析结果的部分用户访问当前数据访问子流程。
所以本实施例中,需要筛选出上一数据访问子流程对应的用户行为分析结果为第二预设用户行为分析结果的非目标用户,然后从所述非目标用户中,筛选出指定数量的非目标用户,并作为新的目标用户。
S23、从所述非目标用户中,筛选出指定数量的非目标用户。
S24、将所述筛选出的指定数量的非目标用户作为新的目标用户,并添加到所述目标用户集合中。
在实际应用中,一般有多个用户访问同一链接,本实施例可以从非目标用户中筛选出一半的用户,作为新的目标用户,添加到所述目标用户集合中,并允许其执行当前数据访问子流程。
对于另一半非目标用户,则禁止该用户继续访问当前数据访问子流程。
需要说明的是,对于浏览、注册激活和业务目标这三个子流程,均有对应的上一数据访问子流程,此时可以根据上一数据访问子流程对应的用户行为分析结果来确定目标用户。但是对于点击/启动这一子流程,并没有上一数据访问子流程,此时所有的用户均作为目标用户,执行点击/启动这一子流程。
在上述确定了目标用户集合之后,该集合中的用户即可作为目标用户,进而可以获取所述目标用户在当前数据访问子流程中生成的当前用户行为数据。
也就是说,获取待分析数据,包括:
筛选出上一数据访问子流程对应的用户行为分析结果为第一预设用户行为分析结果的用户,作为目标用户并添加到目标用户集合中;
筛选出上一数据访问子流程对应的用户行为分析结果为第二预设用户行为分析结果的非目标用户;
从所述非目标用户中,筛选出指定数量的非目标用户;
将所述筛选出的指定数量的非目标用户作为新的目标用户,并添加到所述目标用户集合中;
获取所述目标用户集合中的各个目标用户在当前数据访问子流程中生成的当前用户行为数据。
S12、获取与所述当前数据访问子流程对应的用户行为分析模型。
所述用户行为分析模型基于训练样本训练得到;
具体地,预先获取训练样本,训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本。
本实施例中,可以通过埋点等方式,采集用户在数据访问子流程中的用户行为数据,并作为用户行为数据样本,然后人工对用户行为数据样本进行标注,得到用户行为分析结果样本,标注的内容可以是正常用户和恶意用户。
其中,用户行为数据样本可以作为待标引数据,用户行为分析结果样本为标引结果。
在得到大量的训练样本之后,使用训练样本对用户行为分析模型进行训练,直至满足预设停止训练条件时停止,其中,预设停止训练条件可以是损失函数小于预设阈值。
在训练过程中,用户行为分析模型不断对用户行为数据样本和用户行为分析结果样本进行学习,使得用户行为数据样本的输出结果逐渐与对应的用户行为分析结果样本接近。
S13、调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果。
具体地,直接将待分析数据输入到用户行为分析模型,即可得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果,用户行为分析结果可以是正常用户或恶意用户,如评分在0-50之间的为恶意用户,在50-100之间的为正常用户。
此外,为了对用户进行更详细的划分,可以对用户划分等级,如分为黑、红、橙、黄、绿五个等级,并设置每一等级对应的评分,如0-20,为黑色;20-40,为红色;40-60,为橙色;60-80,为黄色;80-100,为绿色。
用户行为分析模型会输出评分,根据评分值,确定属于哪一等级,若为红、黑中的一个,则将该用户推送至专业人员,人工验证是否是恶意用户,若是,则将该用户的数据,如IP、用户设备ID导入相应黑名单,并作为机器学习训练的负样本。
本实施例中,还可以设置报表系统,用于对所有分析的用户进行用户行为分析结果的汇总和统计,并以图表化的方式展示。根据用户的来源,对其所述的渠道进行分析,得到异常渠道,进而可以对该异常渠道进行警示,使其及时调节提供的流量的好坏。该系统还可以对模型的识别效果进行评估,并与业务线下反馈进行交叉验证,判断模型精确率、召回率、准确率、错误率等指标。
本实施例中,用户行为分析模型预先通过训练样本训练得到,所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本,则使用该用户行为分析模型对用户行为分析时,相比于黑名单的方式,用户行为分析准确度高。进一步,本发明中,数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型,在对用户行为进行分析时,不同的数据访问子流程调用其对应的用户行为分析模型进行用户行为分析,数据分析准确度高,进而提高用户行为分析准确度。
上述实施例在进行用户行为分析时,考虑了用户在当前数据访问子流程中生成的当前用户行为数据,此外,由于上述实施例中,对数据访问流程做了拆分,所以本实施例中,上一数据访问子流程的用户行为分析结果也可以用作评价当前数据访问子流程的用户行为分析结果的一个参数,所以,本实施例中,将上一个子流程的用户行为识别结果可以作为下一个子流程的一个识别特征,从而纳入下一个子流程的用户行为分析中去,最终通过多个模型集成形成了全面体系化的用户行为分析系统。
具体地,所述待分析数据还包括:参考用户行为分析结果;所述参考用户行为分析结果为在所述上一数据访问子流程中所述目标用户对应的用户行为分析结果。
本实施例中,对待分析数据的内容做了补充,为了保证用户行为分析模型能够处理上述的参考用户行为分析结果,也需要对模型的训练样本进行修改,将训练样本增加,所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本,使得模型能够处理上述的新增数据的待分析数据。
进而,在本实施例的基础上,所述用户行为分析模型的生成过程包括:
获取训练样本;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本、所述用户的用户行为分析结果样本以及所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本。
使用所述训练样本对用户行为分析模型进行训练,直至满足预设停止训练条件时停止。
需要说明的是,本实施例中的训练过程与上述的用户行为分析模型的训练过程类似,区别点就是在对训练样本的数据做了增加,其余过程类似,这里不再赘述。
本实施例中,通过对用户行为分析模型的训练样本做了内容增加,使得在进行用户行为分析时,能够考虑上一数据访问子流程的用户行为分析结果,考虑数据全面化,使得确定的用户行为分析结果的准确度提高。
本发明的另一实施例中,给出了具体得到用户行为分析结果的处理过程,参照图4,步骤S13可以包括:
S31、获取与所述当前数据访问子流程对应的预设黑名单。
在实际应用中,对于任一数据访问子流程,均设置有对应的预设黑名单,
对于点击/启动这一子流程,其对应的预设黑名单为IP和设备黑名单,该黑名单中存储有属于黑名单的IP和/或用户设备ID。属于这些黑名单中的IP和/或用户设备ID的用户,被认为属于恶意用户,不属于黑名单中的用户属于正常用户。
对于浏览这一子流程,其对应的黑名单为异常行为黑名单,该黑名单中存储有异常行为,若用户行为属于该黑名单中,则被认为属于恶意用户,若不属于黑名单,属于正常用户。
对于注册激活这一子流程,其对应的黑名单为团体黑名单,该黑名单中存储有团体,若用户所属的团体位于该黑名单中,则被认为属于恶意用户,若不属于黑名单,则属于正常用户。
对于业务目标这一子流程,其对应的黑名单为用户黑名单,该黑名单中存储有各种用户信息,若在业务流程中的用户实名认证信息中的用户位于该黑名单中,则被认为属于恶意用户,若不属于黑名单,则属于正常用户。
本实施例中,对于当前数据访问子流程,获取其对应的预设黑名单。
S32、判断所述预设黑名单中是否包括所述当前用户行为数据,得到判断结果。
具体地,本实施例中,若包括当前用户行为数据,则认为是恶意用户,若不包括当前用户行为数据,则认为是正常用户,得到判断结果。
S33、参照预设筛选规则,从所述判断结果中筛选出目标判断结果,确定所述目标判断结果对应的目标用户,并作为待处理用户。
本实施例中,从目标用户筛选出待处理用户的过程,与上述确定目标用户的过程类似,可以是将所有的用户行为分析结果为正常用户的目标用户作为待处理用户,将一半的用户行为分析结果为恶意用户的目标用户作为待处理用户。
S34、使用所述用户行为分析模型对所述待处理用户的当前用户行为数据以及参考用户行为分析结果进行分析,得到所述待处理用户在所述当前数据访问子流程中的用户行为分析结果。
本实施例中,通过黑名单方式将用户做初步筛选,降低进入到用户行为分析模型中的数据,降低该模型的处理量,提高处理效率。
用户行为分析模型对所述待处理用户的数据的分析结果,同上述的用户行为分析模型对所述目标用户的数据的分析结果的过程,请参照上述相应说明。
本实施例中,在使用用户行为分析模型对用户行为进行分析时,不仅考虑当前数据访问子流程的当前用户行为数据,还考虑上一数据访问子流程的用户行为分析结果,考虑的数据更加全面,能够提高用户行为分析模型的准确度,进而也会提高基于用户行为分析模型确定的用户行为分析结果的准确度,则基于用户行为分析结果进行广告访问控制的准确度也会提高。
上述实施例中,是将上一子流程的用户行为分析结果作为下一子流程的一个分析数据,此外,还可以使用下一子流程的用户行为分析结果来对上一子流程的模型进行调节,提高模型识别准确度。
具体地,参照图5,在步骤S13之后,还可以包括:
S41、获取所述目标用户在所述上一数据访问子流程中的上一用户行为数据,以及所述目标用户在所述上一数据访问子流程之前的上一数据访问子流程中的用户行为分析结果。
本实施例中的各个数据均可以存储在数据库中,本实施例中,直接从数据库中获取所需的数据即可。
S42、将所述目标用户在所述当前数据访问子流程中的用户行为分析结果,确定为所述目标用户在所述上一数据访问子流程中的校正后的用户行为分析结果。
本实施例中,为了实现下一子流程的用户行为分析结果可以对上一子流程的模型进行交叉验证和优化,本实施例中,将下一子流程的用户行为分析结果,作为上一子流程的校正后的用户行为分析结果。
S43、使用所述目标用户在所述上一数据访问子流程中的上一用户行为数据,以及所述目标用户在所述上一数据访问子流程之前的上一数据访问子流程中的用户行为分析结果、以及所述校正后的用户行为分析结果,对所述上一数据访问子流程对应的用户行为分析模型进行训练,直至满足预设停止训练条件时停止。
本实施例的训练过程与上述类似,不同的是,使用下一子流程的用户行为分析结果作为当前子流程的用户行为识别结果,基于该用户行为识别结果,对模型进行优化,使得该模型在在线使用过程中,也能够不断优化。
本实施例中,通过多层动态方式,将多个机器学习算法融合到流量反作弊的不同阶段,能全面及时识别不同类型作弊,而且模型的各个模块可以隔离设计,对算法依赖较小,多个模型可以同步训练,而且上一个模型可以成为下一阶段的模型参数,下一阶段的用户行为分析结果可以作为前面作弊识别的交叉验证标准,使得模型动态变化,提高模型识别准确度。
为了本领域技术人员能够更加清楚的了解本发明,现结合图6进行详细说明,对于上述的点击/启动、浏览、注册激活和业务目标这几个子流程,每一子流程处理过程类似,均包括获取用户行为数据、黑名单判断、用户行为分析模型处理和结果分析这些步骤。其中,获取用户行为数据、黑名单判断、用户行为分析模型处理,请参照上述实施例中的相应解释说明,结果分析对应上述实施例中的结果汇总和统计部分,请参照上述相应说明。
可选地,在上述用户行为的分析方法的实施例的基础上,本发明的另一实施例提供了一种用户行为的分析装置,应用于处理器,所述处理器中预先设置的数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型;
参照图7,所述用户行为的分析装置包括:
数据获取模块11,用于获取待分析数据,所述待分析数据包括:满足预设用户设定规则的目标用户在当前数据访问子流程中生成的当前用户行为数据;所述预设用户设定规则为:用户在上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果满足预设分析结果筛选规则;
模型获取模块12,用于获取与所述当前数据访问子流程对应的用户行为分析模型;所述用户行为分析模型基于训练样本训练得到;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本;
行为分析模块13,用于调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果。
进一步,所述待分析数据还包括:参考用户行为分析结果;所述参考用户行为分析结果为在所述上一数据访问子流程中所述目标用户对应的用户行为分析结果;
所述用户行为分析模型的训练样本还包括:所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本。
进一步,所述行为分析模块包括:
名单获取子模块,用于获取与所述当前数据访问子流程对应的预设黑名单;
判断子模块,用于判断所述预设黑名单中是否包括所述当前用户行为数据,得到判断结果;
筛选子模块,用于参照预设筛选规则,从所述判断结果中筛选出目标判断结果,确定所述目标判断结果对应的目标用户,并作为待处理用户;
行为分析子模块,用于使用所述用户行为分析模型对所述待处理用户的当前用户行为数据以及参考用户行为分析结果进行分析,得到所述待处理用户在所述当前数据访问子流程中的用户行为分析结果。
进一步,还包括:
信息获取模块,用于获取所述目标用户在所述上一数据访问子流程中的上一用户行为数据,以及所述目标用户在所述上一数据访问子流程之前的上一数据访问子流程中的用户行为分析结果;
结果确定模块,用于将所述目标用户在所述当前数据访问子流程中的用户行为分析结果,确定为所述目标用户在所述上一数据访问子流程中的校正后的用户行为分析结果;
训练模块,用于使用所述目标用户在所述上一数据访问子流程中的上一用户行为数据,以及所述目标用户在所述上一数据访问子流程之前的上一数据访问子流程中的用户行为分析结果、以及所述校正后的用户行为分析结果,对所述上一数据访问子流程对应的用户行为分析模型进行训练,直至满足预设停止训练条件时停止。
进一步,数据获取模块11包括:
第一筛选子模块,用于筛选出上一数据访问子流程对应的用户行为分析结果为第一预设用户行为分析结果的用户,作为目标用户并添加到目标用户集合中;
第二筛选子模块,用于筛选出上一数据访问子流程对应的用户行为分析结果为第二预设用户行为分析结果的非目标用户;
第三筛选子模块,用于从所述非目标用户中,筛选出指定数量的非目标用户;
用户添加子模块,用于将所述筛选出的指定数量的非目标用户作为新的目标用户,并添加到所述目标用户集合中;
数据获取子模块,用于获取所述目标用户集合中的各个目标用户在当前数据访问子流程中生成的当前用户行为数据。
进一步,还包括模型生成模块,模型生成模块包括:
样本获取子模块,用于获取训练样本;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本、所述用户的用户行为分析结果样本以及所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本;
训练子模块,用于使用所述训练样本对用户行为分析模型进行训练,直至满足预设停止训练条件时停止。
本实施例中,用户行为分析模型预先通过训练样本训练得到,所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本,则使用该用户行为分析模型对用户行为分析时,相比于黑名单的方式,用户行为分析准确度高。进一步,本发明中,数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型,在对用户行为进行分析时,不同的数据访问子流程调用其对应的用户行为分析模型进行用户行为分析,数据分析准确度高,进而提高用户行为分析准确度。
需要说明的是,本实施例中的各个模块和子模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
可选地,在上述用户行为的分析方法及装置的实施例的基础上,本发明的另一实施例提供了一种电子设备,包括:存储器和处理器;所述存储器中预先设置的数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型;
其中,所述存储器用于存储程序;
处理器调用程序并用于:
获取待分析数据,所述待分析数据包括:满足预设用户设定规则的目标用户在当前数据访问子流程中生成的当前用户行为数据;所述预设用户设定规则为:用户在上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果满足预设分析结果筛选规则;
获取与所述当前数据访问子流程对应的用户行为分析模型;所述用户行为分析模型基于训练样本训练得到;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本;
调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果。
进一步,所述待分析数据还包括:参考用户行为分析结果;所述参考用户行为分析结果为在所述上一数据访问子流程中所述目标用户对应的用户行为分析结果;
所述用户行为分析模型的训练样本还包括:所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本。
进一步,所述调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果,包括:
获取与所述当前数据访问子流程对应的预设黑名单;
判断所述预设黑名单中是否包括所述当前用户行为数据,得到判断结果;
参照预设筛选规则,从所述判断结果中筛选出目标判断结果,确定所述目标判断结果对应的目标用户,并作为待处理用户;
使用所述用户行为分析模型对所述待处理用户的当前用户行为数据以及参考用户行为分析结果进行分析,得到所述待处理用户在所述当前数据访问子流程中的用户行为分析结果。
进一步,在所述调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果之后,还包括:
获取所述目标用户在所述上一数据访问子流程中的上一用户行为数据,以及所述目标用户在所述上一数据访问子流程之前的上一数据访问子流程中的用户行为分析结果;
将所述目标用户在所述当前数据访问子流程中的用户行为分析结果,确定为所述目标用户在所述上一数据访问子流程中的校正后的用户行为分析结果;
使用所述目标用户在所述上一数据访问子流程中的上一用户行为数据,以及所述目标用户在所述上一数据访问子流程之前的上一数据访问子流程中的用户行为分析结果、以及所述校正后的用户行为分析结果,对所述上一数据访问子流程对应的用户行为分析模型进行训练,直至满足预设停止训练条件时停止。
进一步,所述获取待分析数据包括:
筛选出上一数据访问子流程对应的用户行为分析结果为第一预设用户行为分析结果的用户,作为目标用户并添加到目标用户集合中;
筛选出上一数据访问子流程对应的用户行为分析结果为第二预设用户行为分析结果的非目标用户;
从所述非目标用户中,筛选出指定数量的非目标用户;
将所述筛选出的指定数量的非目标用户作为新的目标用户,并添加到所述目标用户集合中;
获取所述目标用户集合中的各个目标用户在当前数据访问子流程中生成的当前用户行为数据。
进一步,所述用户行为分析模型的生成过程包括:
获取训练样本;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本、所述用户的用户行为分析结果样本以及所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本;
使用所述训练样本对用户行为分析模型进行训练,直至满足预设停止训练条件时停止。
本实施例中,用户行为分析模型预先通过训练样本训练得到,所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本,则使用该用户行为分析模型对用户行为分析时,相比于黑名单的方式,用户行为分析准确度高。进一步,本发明中,数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型,在对用户行为进行分析时,不同的数据访问子流程调用其对应的用户行为分析模型进行用户行为分析,数据分析准确度高,进而提高用户行为分析准确度。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种用户行为的分析方法,其特征在于,应用于处理器,所述处理器中预先设置的数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型;
所述用户行为的分析方法包括:
获取待分析数据,所述待分析数据包括:满足预设用户设定规则的目标用户在当前数据访问子流程中生成的当前用户行为数据;所述预设用户设定规则为:用户在上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果满足预设分析结果筛选规则;所述预设分析结果筛选规则为:用于将所述上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果表示为正常用户的用户确定为目标用户的规则,或,用于将所述上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果表示为恶意用户的部分用户以及表示为正常用户的用户确定为目标用户的规则;
获取与所述当前数据访问子流程对应的用户行为分析模型;所述用户行为分析模型基于训练样本训练得到;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本;
调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果。
2.根据权利要求1所述的分析方法,其特征在于,所述待分析数据还包括:参考用户行为分析结果;所述参考用户行为分析结果为在所述上一数据访问子流程中所述目标用户对应的用户行为分析结果;
所述用户行为分析模型的训练样本还包括:所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本。
3.根据权利要求2所述的分析方法,其特征在于,所述调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果,包括:
获取与所述当前数据访问子流程对应的预设黑名单;
判断所述预设黑名单中是否包括所述当前用户行为数据,得到判断结果;其中,若所述预设黑名单中包括所述当前用户行为数据,则将当前用户确定为恶意用户,若所述预设黑名单中不包括所述当前用户行为数据,则将当前用户确定为正常用户;
参照预设筛选规则,从所述判断结果中筛选出目标判断结果,确定所述目标判断结果对应的目标用户,并作为待处理用户;所述预设筛选规则为:用于将基于所述预设黑名单确定出的正常用户确定为待处理用户的规则,或,用于将基于所述预设黑名单确定出的恶意用户中的部分用户以及确定出的正常用户确定为待处理用户的规则;
使用所述用户行为分析模型对所述待处理用户的当前用户行为数据以及参考用户行为分析结果进行分析,得到所述待处理用户在所述当前数据访问子流程中的用户行为分析结果。
4.根据权利要求3所述的分析方法,其特征在于,在所述调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果之后,还包括:
获取所述目标用户在所述上一数据访问子流程中的上一用户行为数据,以及所述目标用户在所述上一数据访问子流程之前的上一数据访问子流程中的用户行为分析结果;
将所述目标用户在所述当前数据访问子流程中的用户行为分析结果,确定为所述目标用户在所述上一数据访问子流程中的校正后的用户行为分析结果;
使用所述目标用户在所述上一数据访问子流程中的上一用户行为数据,以及所述目标用户在所述上一数据访问子流程之前的上一数据访问子流程中的用户行为分析结果、以及所述校正后的用户行为分析结果,对所述上一数据访问子流程对应的用户行为分析模型进行训练,直至满足预设停止训练条件时停止。
5.根据权利要求1所述的分析方法,其特征在于,所述获取待分析数据包括:
筛选出上一数据访问子流程对应的用户行为分析结果为第一预设用户行为分析结果的用户,作为目标用户并添加到目标用户集合中;
筛选出上一数据访问子流程对应的用户行为分析结果为第二预设用户行为分析结果的非目标用户;
从所述非目标用户中,筛选出指定数量的非目标用户;
将所述筛选出的指定数量的非目标用户作为新的目标用户,并添加到所述目标用户集合中;
获取所述目标用户集合中的各个目标用户在当前数据访问子流程中生成的当前用户行为数据。
6.根据权利要求2所述的分析方法,其特征在于,所述用户行为分析模型的生成过程包括:
获取训练样本;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本、所述用户的用户行为分析结果样本以及所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本;
使用所述训练样本对用户行为分析模型进行训练,直至满足预设停止训练条件时停止。
7.一种用户行为的分析装置,其特征在于,应用于处理器,所述处理器中预先设置的数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型;
所述用户行为的分析装置包括:
数据获取模块,用于获取待分析数据,所述待分析数据包括:满足预设用户设定规则的目标用户在当前数据访问子流程中生成的当前用户行为数据;所述预设用户设定规则为:用户在上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果满足预设分析结果筛选规则;所述预设分析结果筛选规则为:用于将所述上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果表示为正常用户的用户确定为目标用户的规则,或,用于将所述上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果表示为恶意用户的部分用户以及表示为正常用户的用户确定为目标用户的规则;
模型获取模块,用于获取与所述当前数据访问子流程对应的用户行为分析模型;所述用户行为分析模型基于训练样本训练得到;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本;
行为分析模块,用于调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果。
8.根据权利要求7所述的分析装置,其特征在于,所述待分析数据还包括:参考用户行为分析结果;所述参考用户行为分析结果为在所述上一数据访问子流程中所述目标用户对应的用户行为分析结果;
所述用户行为分析模型的训练样本还包括:所述用户在所述上一数据访问子流程中的用户行为数据对应的用户行为分析结果样本。
9.根据权利要求8所述的分析装置,其特征在于,所述行为分析模块包括:
名单获取子模块,用于获取与所述当前数据访问子流程对应的预设黑名单;
判断子模块,用于判断所述预设黑名单中是否包括所述当前用户行为数据,得到判断结果;其中,若所述预设黑名单中包括所述当前用户行为数据,则将当前用户确定为恶意用户,若所述预设黑名单中不包括所述当前用户行为数据,则将当前用户确定为正常用户;
筛选子模块,用于参照预设筛选规则,从所述判断结果中筛选出目标判断结果,确定所述目标判断结果对应的目标用户,并作为待处理用户;所述预设筛选规则为:用于将基于所述预设黑名单确定出的正常用户确定为待处理用户的规则,或,用于将基于所述预设黑名单确定出的恶意用户中的部分用户以及确定出的正常用户确定为待处理用户的规则;
行为分析子模块,用于使用所述用户行为分析模型对所述待处理用户的当前用户行为数据以及参考用户行为分析结果进行分析,得到所述待处理用户在所述当前数据访问子流程中的用户行为分析结果。
10.一种电子设备,其特征在于,包括:存储器和处理器;所述存储器中预先设置的数据访问流程包括多个按照顺序排列的数据访问子流程,不同的数据访问子流程对应有不同的用户行为分析模型;
其中,所述存储器用于存储程序;
处理器调用程序并用于:
获取待分析数据,所述待分析数据包括:满足预设用户设定规则的目标用户在当前数据访问子流程中生成的当前用户行为数据;所述预设用户设定规则为:用户在上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果满足预设分析结果筛选规则;所述预设分析结果筛选规则为:用于将所述上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果表示为正常用户的用户确定为目标用户的规则,或,用于将所述上一数据访问子流程中生成的用户行为数据对应的用户行为分析结果表示为恶意用户的部分用户以及表示为正常用户的用户确定为目标用户的规则;
获取与所述当前数据访问子流程对应的用户行为分析模型;所述用户行为分析模型基于训练样本训练得到;所述训练样本包括用户在所述当前数据访问子流程中的用户行为数据样本以及所述用户的用户行为分析结果样本;
调用所述用户行为分析模型对所述待分析数据进行分析,得到所述目标用户在所述当前数据访问子流程中的用户行为分析结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110365553.7A CN112733045B (zh) | 2021-04-06 | 2021-04-06 | 用户行为的分析方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110365553.7A CN112733045B (zh) | 2021-04-06 | 2021-04-06 | 用户行为的分析方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112733045A CN112733045A (zh) | 2021-04-30 |
CN112733045B true CN112733045B (zh) | 2021-06-22 |
Family
ID=75596474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110365553.7A Active CN112733045B (zh) | 2021-04-06 | 2021-04-06 | 用户行为的分析方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112733045B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114240490A (zh) * | 2021-12-15 | 2022-03-25 | 湖南创研科技股份有限公司 | 一种基于网络粉丝用户的大数据行为分析方法及系统 |
CN114064440A (zh) * | 2022-01-18 | 2022-02-18 | 恒生电子股份有限公司 | 可信度分析模型的训练方法、可信度分析方法及相关装置 |
CN114500077A (zh) * | 2022-02-14 | 2022-05-13 | 科来网络技术股份有限公司 | 访问行为监控方法、装置、服务器及可读存储介质 |
CN114885006A (zh) * | 2022-05-10 | 2022-08-09 | 四川封面传媒科技有限责任公司 | 基于综合特征识别真实用户的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544190A (zh) * | 2018-11-28 | 2019-03-29 | 北京芯盾时代科技有限公司 | 一种欺诈识别模型训练方法、欺诈识别方法及装置 |
CN111262854A (zh) * | 2020-01-15 | 2020-06-09 | 卓望数码技术(深圳)有限公司 | 互联网反作弊行为方法、装置、设备和可读存储介质 |
CN111861568A (zh) * | 2020-07-23 | 2020-10-30 | 上海志窗信息科技有限公司 | 互联网广告监控系统及其方法 |
CN112580952A (zh) * | 2020-12-09 | 2021-03-30 | 腾讯科技(深圳)有限公司 | 用户行为风险预测方法、装置、电子设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170187737A1 (en) * | 2015-12-28 | 2017-06-29 | Le Holdings (Beijing) Co., Ltd. | Method and electronic device for processing user behavior data |
CN107316198B (zh) * | 2016-04-26 | 2020-05-29 | 阿里巴巴集团控股有限公司 | 账户风险识别方法及装置 |
CN110163380B (zh) * | 2018-04-28 | 2023-07-07 | 腾讯科技(深圳)有限公司 | 数据分析方法、模型训练方法、装置、设备及存储介质 |
CN109165691B (zh) * | 2018-09-05 | 2022-04-22 | 北京奇艺世纪科技有限公司 | 用于识别作弊用户的模型的训练方法、装置及电子设备 |
-
2021
- 2021-04-06 CN CN202110365553.7A patent/CN112733045B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544190A (zh) * | 2018-11-28 | 2019-03-29 | 北京芯盾时代科技有限公司 | 一种欺诈识别模型训练方法、欺诈识别方法及装置 |
CN111262854A (zh) * | 2020-01-15 | 2020-06-09 | 卓望数码技术(深圳)有限公司 | 互联网反作弊行为方法、装置、设备和可读存储介质 |
CN111861568A (zh) * | 2020-07-23 | 2020-10-30 | 上海志窗信息科技有限公司 | 互联网广告监控系统及其方法 |
CN112580952A (zh) * | 2020-12-09 | 2021-03-30 | 腾讯科技(深圳)有限公司 | 用户行为风险预测方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112733045A (zh) | 2021-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112733045B (zh) | 用户行为的分析方法、装置及电子设备 | |
US10484413B2 (en) | System and a method for detecting anomalous activities in a blockchain network | |
CN111614690B (zh) | 一种异常行为检测方法及装置 | |
CN109120429B (zh) | 一种风险识别方法及系统 | |
CN110442712B (zh) | 风险的确定方法、装置、服务器和文本审理系统 | |
US20210126931A1 (en) | System and a method for detecting anomalous patterns in a network | |
CN111435507A (zh) | 广告反作弊方法、装置、电子设备及可读存储介质 | |
CN109120428B (zh) | 一种用于风控分析的方法及系统 | |
CN104836781A (zh) | 区分访问用户身份的方法及装置 | |
CN111163065A (zh) | 异常用户检测方法及装置 | |
CN116996325B (zh) | 一种基于云计算的网络安全检测方法及系统 | |
CN111612085B (zh) | 一种对等组中异常点的检测方法及装置 | |
CN111611519B (zh) | 一种个人异常行为检测方法及装置 | |
CN112307464A (zh) | 诈骗识别方法、装置及电子设备 | |
CN112184241A (zh) | 一种身份认证的方法及装置 | |
CN111797942A (zh) | 用户信息的分类方法及装置、计算机设备、存储介质 | |
CN111582722B (zh) | 风险识别方法、装置、电子设备及可读存储介质 | |
CN113065748A (zh) | 业务风险评估方法、装置、设备及存储介质 | |
EP4169223A1 (en) | Method and apparatus to detect scripted network traffic | |
CN110460593B (zh) | 一种移动流量网关的网络地址识别方法、装置及介质 | |
CN113918534A (zh) | 一种策略处理系统及方法 | |
CN109190408B (zh) | 一种数据信息的安全处理方法及系统 | |
US9843559B2 (en) | Method for determining validity of command and system thereof | |
CN116318974A (zh) | 站点风险识别方法、装置、计算机可读介质及电子设备 | |
CN116319065A (zh) | 一种应用于商业运维的威胁态势分析方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address |
Address after: Room 716, 7 / F, building 2, 28 Andingmen East Street, Dongcheng District, Beijing Patentee after: Beijing Easy Yikang Information Technology Co.,Ltd. Address before: Room 716, 7 / F, building 2, 28 Andingmen East Street, Dongcheng District, Beijing Patentee before: BEIJING QINGSONGCHOU INFORMATION TECHNOLOGY Co.,Ltd. |
|
CP03 | Change of name, title or address |