CN111861545A - 用户行为画像的构建方法、装置、设备及存储介质 - Google Patents

用户行为画像的构建方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111861545A
CN111861545A CN202010573448.8A CN202010573448A CN111861545A CN 111861545 A CN111861545 A CN 111861545A CN 202010573448 A CN202010573448 A CN 202010573448A CN 111861545 A CN111861545 A CN 111861545A
Authority
CN
China
Prior art keywords
user behavior
grouping
behavior
user
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010573448.8A
Other languages
English (en)
Other versions
CN111861545B (zh
Inventor
刘婧
钟盛海
肖崇蕙
王丽宏
闫昊
马莉雅
郭舒
黄洪仁
王士承
黑一鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Computer Network and Information Security Management Center
Original Assignee
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Computer Network and Information Security Management Center filed Critical National Computer Network and Information Security Management Center
Priority to CN202010573448.8A priority Critical patent/CN111861545B/zh
Publication of CN111861545A publication Critical patent/CN111861545A/zh
Application granted granted Critical
Publication of CN111861545B publication Critical patent/CN111861545B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请涉及一种用户行为画像的构建方法、装置、设备及存储介质,所述方法包括:构建用户行为画像模型;生成用户行为特征向量和生成行为对象特征向量;计算分组判别结果与设定分组的分组误差,和,将用户行为特征向量和行为对象特征向量重构生成行为矩阵,并计算重构生成的行为矩阵为用户行为矩阵的生成概率;根据最小化模型方法,优化用户行为画像模型,更新用户行为画像模型参数;用户行为画像模型构建成功,向构建成功的用户行为画像模型输入用户行为数据,获得与用户行为数据对应的用户行为画像。用以解决现有的用户行为画像模型构建时更专注于用户的共性,难以获取具有个性化且可区分性的用户行为画像的问题。

Description

用户行为画像的构建方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种用户行为画像的构建 方法、装置、设备及存储介质。
背景技术
用户行为画像作为建立于一系列真实的用户行为数据之上的目标 用户模型,已经成功应用于互联网企业与各大公司的商品推荐、好友 发现等传统的商业应用。目前,在异常用户发现、商品精准推广、用 户个性化服务等新背景中,用户画像的个性化特征发挥着重大的作用。
目前构建用户行为画像进行用户行为描述的方式主要有两类方法: 基于数据统计的方法和基于智能学习模型的方法。基于数据统计的方 法主要是依赖于常用的统计方法获取原始数据的统计特征,并直接用 其构建用户的行为画像;基于智能学习模型的方法主要是根据行为数 据的特性和用户行为之间的共性构建对应的端到端的学习算法,直接通过用户数据学习用户的行为画像。当前的基于统计的用户行为画像 仅能表示用户行为的统计信息,如果用户的用户行为画像存在其他关 联时难以有效的判别该用户的差异特征和该用户准确的分组。此外, 目前基于智能学习模型的方法构建的用户行为画像更专注于用户行为 的表征和用户行为之间的共性,无法有效的量化用户之间的差异性。
发明内容
本申请提供了一种用户行为画像的构建方法、装置、设备及存储 介质,用以解决现有的用户行为画像模型构建时更专注于用户的共性, 难以获取具有个性化且可区分性的用户行为画像的问题。
第一方面,本申请提供了一种用户行为画像的构建方法,包括:
构建用户行为画像模型,其中,所述用户行为画像模型包括:用 户行为特征生成模块和行为对象特征生成模块,所述用户行为特征生 成模块包括用户行为分组变量参数和用户行为分布变量参数,所述行 为对象特征生成模块包括行为对象分组变量参数和行为对象分布变量 参数;
对所述用户行为分组变量参数和所述用户行为分布变量参数初始 化处理,获得用户行为分组分布参数,对所述行为对象分组变量参数 和所述行为对象分布变量参数初始化处理,获得行为对象分组分布参 数;
由所述用户行为特征生成模块根据所述用户行为分组分布参数生 成用户行为特征向量,由所述行为对象特征生成模块根据所述行为对 象分组分布参数生成行为对象特征向量;
对生成的所述用户行为特征向量进行分组设定,获得设定分组, 并计算分组判别结果与所述设定分组的分组误差,和,将所述用户行 为特征向量和所述行为对象特征向量重构生成行为矩阵,并计算所述 重构生成的所述行为矩阵为用户行为矩阵的生成概率,其中,所述分 组判别结果为:给所述用户行为画像模型添加分组权重变量后获得的 分组,所述用户行为矩阵通过用户行为数据构建得到;
根据最小化模型方法,优化所述用户行为画像模型,更新所述用 户行为画像模型的所述用户行为分组变量参数、所述用户行为分布变 量参、所述行为对象分组变量参数和所述行为对象分布变量参数;
当更新后的所述用户行为画像模型的所述分组误差和所述生成概 率之和小于预设阈值时,所述用户行为画像模型构建成功,向构建成 功的所述用户行为画像模型输入所述用户行为数据,获得与所述用户 行为数据对应的用户行为画像。
可选地构建用户行为画像模型之前,还包括:
获取所述用户的用户行为数据;
提取所述用户行为数据的关键字段,构建用户行为记录,其中, 所述关键字段包括:唯一标识、行为对象和发生时间;
遍历所述用户行为记录,滤除所述关键字段缺失的所述用户行为 记录,并根据滤除后的所述用户行为记录的所述关键字段构建所述用 户行为矩阵;
根据所述关键字段,统计用户行为的发生频次,并采用所述发生 频次更新所述用户行为矩阵中对应的频度值。
可选地,对所述用户行为分组变量参数和所述用户行为分布变量 参数初始化处理,获得用户行为分组分布参数之后,还包括:
给所述用户行为画像模型添加所述分组权重变量,所述分组权重 变量用于减小所述分组判别结果与所述设定分组的所述分组误差;
对添加所述分组权重变量后的用户行为画像模型进行初始化处 理,通过所述用户行为特征生成模块获得所述用户行为特征向量;
根据所述获得的用户行为特征向量,获得所述用户行为特征向量 对应的分组判别结果。
可选地,由所述用户行为特征生成模块根据所述用户行为分组分 布参数生成用户行为特征向量,包括:
由所述用户行为特征生成模块根据所述用户行为分组变量参数生 成所述用户行为特征向量的分组划分概率;
选择所述分组划分概率大于预设概率值的分组划分概率所对应的 组别;
根据所述组别,生成所述组别对应的用户行为特征向量。
可选地,计算分组判别结果与所述设定分组的分组误差,包括:
通过基于概率的分类算法,对所述分组判别结果对应的第二标签 和所述设定分组对应的第一标签进行比较计算;
根据比较结果,确定所述分组判别结果与所述设定分组的分组误 差;
其中,所述第一标签为所述设定分组中的用户行为特征,所述第 二标签为所述分组判别结果中的用户行为特征。
可选地,计算所述分组判别结果与所述设定分组的分组误差之 后,还包括:
获得分组误差计算结果;
当所述分组误差计算结果小于预设误差值时,不调整所述分组权 重变量;
当所述分组误差计算结果不小于预设误差值时,调整所述分组权 重变量,并在调整所述分组权重变量后,获得调整后的所述用户行为 特征向量。
可选地,向构建成功的所述用户行为画像模型输入所述用户行为 数据,获得与所述用户行为数据对应的用户行为画像之后,还包括:
通过构建成功的所述用户行为画像模型获得待识别用户的用户行 为画像;
将所述获得的待识别用户的用户行为画像在画像库中进行距离判 别;
当距离判别结果小于预设距离值时,判定所述待识别用户认证成 功。
第二方面,本申请提供了一种用户行为画像的构建装置,包括:
构建单元,用于构建用户行为画像模型,其中,所述用户行为画 像模型包括:用户行为特征生成模块和行为对象特征生成模块,所述 用户行为特征生成模块包括用户行为分组变量参数和用户行为分布变 量参数,所述行为对象特征生成模块包括行为对象分组变量参数和行 为对象分布变量参数;
获得单元,用于对所述用户行为分组变量参数和所述用户行为分 布变量参数初始化处理,获得用户行为分组分布参数,对所述行为对 象分组变量参数和所述行为对象分布变量参数初始化处理,获得行为 对象分组分布参数;
生成单元,用于由所述用户行为特征生成模块根据所述用户行为 分组分布参数生成用户行为特征向量,由所述行为对象特征生成模块 根据所述行为对象分组分布参数生成行为对象特征向量;
判别单元,用于对生成的所述用户行为特征向量进行分组设定, 获得设定分组,并计算分组判别结果与所述设定分组的分组误差,和, 将所述用户行为特征向量和所述行为对象特征向量重构生成行为矩 阵,并计算所述重构生成的行为矩阵为用户行为矩阵的生成概率,其 中,所述分组判别结果为:给所述用户行为画像模型添加分组权重变 量后获得的分组,所述用户行为矩阵通过用户行为数据构建得到;
更新单元,用于根据最小化模型方法,优化所述用户行为画像模 型,更新所述用户行为画像模型的所述用户行为分组变量参数、所述 用户行为分布变量参、所述行为对象分组变量参数和所述行为对象分 布变量参数;
判定单元,用于当更新后的所述用户行为画像模型的所述分组误 差和所述生成概率之和小于预设阈值时,所述用户行为画像模型构建 成功,向构建成功的所述用户行为画像模型输入所述用户行为数据, 获得与所述用户行为数据对应的用户行为画像。
第三方面,本申请提供了一种电子设备,包括:处理器、通信组 件、存储器和通信总线,其中,处理器、通信组件和存储器通过通信 总线完成相互间的通信;所述存储器,用于存储计算机程序;所述处 理器,用于执行所述存储器中所存储的程序,实现所述的用户行为画 像的构建方法。
第四方面,本申请提供了一种计算机可读存储介质,存储有计算 机程序,所述计算机程序被处理器执行时实现所述的用户行为画像的 构建方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优 点:本申请实施例提供的该方法,通过构建用户行为画像模型,对该 用户行为画像模型参数进行处理,生成用户行为特征向量和行为对象 特征向量,更好的获得用户的用户行为特征和行为对象特征,即获得 该用户所具有的各项特征。进一步地,对生成的用户行为特征向量进 行分组设定,获得设定分组,并和添加分组权重变量后获得的分组判 别结果进行分组误差计算,和,将生成的用户行为特征向量和行为对 象特征向量进行矩阵重构,并计算重构生成的行为矩阵为用户行为矩 阵的生成概率。通过添加分组权重变量参数,可以利用分组权重对不同分组用户的行为画像作出明显的区分,使该用户行为画像模型生成 具有个性化和差异性的用户行为画像。再者,通过根据最小化模型方 法优化该用户行为画像模型,并更新该用户行为画像模型的用户行为 分组变量参数、用户行为分布变量参、行为对象分组变量参数和行为 对象分布变量参数,直至更新后的用户行为画像模型的分组误差和生 成概率之和小于预设阈值时,所述用户行为画像模型构建成功。此时 的用户行为画像模型可以生成待识别用户的具有普遍性的和个性化的 用户行为画像,且可以利用分组权重对不同分组用户的行为画像做出 明显的区分。进一步的,商家可以根据生成的用户行为画像的普遍性特征进行用户商品推荐、好友发现等任务,同时可以利用用户行为画 像的个性化特性进行用户认证、商品精准推广、用户个性化服务等对 用户个体和群体具有偏向性的商业任务。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符 合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面 将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而 易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前 提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中用户行为画像的构建方法流程示意图;
图2为本申请实施例中用户行为画像模型的计算架构结构示意 图;
图3为本申请实施例中用户行为画像模型的参数更新流程示意 图;
图4为本申请实施例中用户行为画像的构建装置结构示意图;
图5为本申请实施例中电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结 合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、 完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不 是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没 有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请 保护的范围。
本申请实施例中,提供了一种用户行为画像的构建方法,该方法 可以应用在智能终端设备中,例如,手机、电脑、ipad,也可以应用在 安装在智能终端设备的应用程序中,例如,购物类应用程序、游戏类 应用程序、新闻类应用程序、视频类应用程序等,也可以应用在服务 器中。如图1所示,该方法的构建过程具体如下:
步骤101,构建用户行为画像模型,其中,该用户行为画像模型包 括:用户行为特征生成模块和行为对象特征生成模块,用户行为特征 生成模块包括用户行为分组变量参数和用户行为分布变量参数,行为 对象特征生成模块包括行为对象分组变量参数和行为对象分布变量参 数。
一个具体实施例中,在构建用户行为画像模型时,该模型不具备 任何用户行为特征,只是搭建该用户行为画像的计算框架。如图2所 示,该用户行为画像模型的计算框架,包括:用户行为特征生成模块 201、行为对象特征生成模块202和模型优化评估模块203。其中,该 用户行为特征生成模块201用于将用户行为分组,进而生成用户行为 特征向量,即用户行为画像;行为对象特征生成模块202用于将行为 对象分组,进而生成行为对象特征向量;模型优化评估模块203,包括: 误差评估模块2031和重构概率评估模块2032,误差评估模块2031用 户计算用户错误分组的距离误差,即通过计算分组判别结果和设定分 组之间的差异信息来限制不同分组用户的用户行为画像之间的类别差 异;重构概率评估模块2032用于计算用户行为画像和行为对象特征向 量重构成用户行为矩阵的概率大小。通过结合两种不同类型的误差计 算方法,用以学习高质量的用户行为特征和行为对象特征,让用户行 为画像具有较高的实用性,并且能具有较好的群体判别性。
步骤102,对用户行为分组变量参数和用户行为分布变量参数初始 化处理,获得用户行为分组分布参数,对行为对象分组变量参数和行 为对象分布变量参数初始化处理,获得行为对象分组分布参数。
一个具体实施例中,假设该用户行为画像模型的参数及其数据的 分布如下:
(1)用户行为分组分布符合贝塔(Beta)分布:
Figure BDA0002550207540000081
(2)行为对象分组分布符合Beta分布:
Figure BDA0002550207540000082
进一步地,通过初始化处理获得:
(3)用户行为分组分布参数的数据为:
Figure BDA0002550207540000083
(4)行为对象分组分布参数的数据为:
Figure BDA0002550207540000084
其中,ui表示第i个用户行为;
Figure BDA0002550207540000091
表示第i个用户行为分组分布参数;vj表示第j个行为对象;
Figure BDA0002550207540000092
表示第j个行为对象分组分布参数;
Figure BDA0002550207540000093
表示第i 个用户行为在第m个分组的可能性;
Figure BDA0002550207540000094
表示用户行为第m个分组的参 数;
Figure BDA0002550207540000095
表示第j个行为对象在第n个分组的可能性;
Figure BDA0002550207540000096
表示表示行为对 象第n个分组的参数,用户行为分组分布参数的初始均值为0,行为对 象分组分布参数的初始均值为0;
Figure BDA0002550207540000097
Figure BDA0002550207540000098
Figure BDA0002550207540000099
t表示遍历已存在分组时 的下标,t小于当前计算的分组的个数。
步骤103,由用户行为特征生成模块根据用户行为分组分布参数生 成用户行为特征向量,由行为对象特征生成模块根据行为对象分组分 布参数生成行为对象特征向量。
一个具体实施例中,用户行为特征生成模块根据用户行为分组变 量参数生成用户行为特征向量的分组划分概率,可以定义为第一分组 划分概率,选择第一分组划分概率大于第一预设概率值的分组划分概 率所对应的组别。其中,该组别可能为一组也可能为多组。进一步地, 根据该组别生成该用户的用户行为特征向量,即用户行为画像。另外, 行为对象特征生成模块根据行为对象分组变量参数生成行为对象特征 的分组划分概率,可以定义为第二分组划分概率,选择第二分组划分 概率大于第二预设概率值的分组划分概率所对应的组别,其中,该组 别可能为一组也可能为多组。进一步地,根据组别生成该用户的行为 对象特征向量。
其中,假设用户行为特征向量的基础单位符合k维高斯(Gaussian) 分布:
Figure BDA00025502075400000910
假设行为对象特征向量的基础单位符合k维Gaussian分布:
Figure BDA0002550207540000101
生成的用户行为特征向量为:
Figure BDA0002550207540000102
生成的行为对象特征向量为:
Figure BDA0002550207540000103
其中,
Figure BDA0002550207540000104
表示用户第i个用户行为对应分组的序号;
Figure BDA0002550207540000105
表示第 i个用户行为对应分组分布的均值参数;
Figure BDA0002550207540000106
表示第i个用户行为对应 分组的方差参数;
Figure BDA0002550207540000107
表示用户第j个行为对象对应分组的序号;
Figure BDA0002550207540000108
表示第j个行为对象对应分组分布的均值参数;
Figure BDA0002550207540000109
第j个行为对象对 应分组分布的方差参数。
其中,大于第一预设概率值的分组划分概率所对应的第二组别的 下标可以表示为:
Figure BDA00025502075400001010
其中,
Figure BDA00025502075400001011
表示 第i个用户行为在第m个分组的可能性,最终将
Figure BDA00025502075400001012
最大的m作为该用户 行为分组的索引号。另外,大于第二预设概率值的分组划分概率所对 应的第三组别的下标可以表示为:
Figure BDA00025502075400001013
其中,
Figure BDA00025502075400001014
表示第i个用户行为在第n个分组的可能性,最终将
Figure BDA00025502075400001015
最大的n 作为该行为对象分组的索引号。
又一具体实施例中,在用户行为特征向量生成的过程中,需要通 过狄利克雷分布算法对用户行为进行聚类分析,并生成相对应的组别, 然后根据该组别的数据的分组分布生成对应的用户行为特征向量;在 行为对象特征向量生成的过程中,需要通过狄利克雷分布算法对行为 对象进行聚类分析,并生成相对应的组别,然后根据该组别的数据的 分组分布生成对应的行为对象特征向量。通过采用狄利克雷分布算法 对用户行为和行为对象进行聚类分析,有利于减少模型的参数数量, 提高模型的训练速度,加速模型的收敛。
步骤104,对生成的用户行为特征向量进行分组设定,获得设定分 组,并计算分组判别结果与设定分组的分组误差,和,将用户行为特 征向量和行为对象特征向量重构生成行为矩阵,并计算重构生成的行 为矩阵为用户行为矩阵的生成概率,其中,分组判别结果为:给所述 用户行为画像模型添加分组权重变量后获得的分组,用户行为矩阵通 过用户行为数据构建得到。
一个具体实施例中,用户行为矩阵的构建过程为:通过数据接口 获取用户某个时间段的用户行为数据,该时间段可以是近期一个月、 半年或者一年等。然后,提取该用户行为数据的关键字段,包括:唯 一标识、行为对象和发生时间等,并利用这些关键字段构成的数据信 息构建用户行为记录。下一步,遍历该用户行为记录,滤除掉关键字 段缺失和重复的用户行为记录,并根据滤除后的用户行为记录的关键 字段建立用户行为矩阵R,用户行为矩阵的初始值为0。
例如,通过数据接口获取用户一个月内,打开购物类应用程序的 程序名称、打开时间和打开次数,打开游戏类应用程序的程序名称、 打开时间和打开次数,打开视频类应用程序的程序名称、打开时间和 打开次数,并利用这些关键字段构成的数据信息构建用户行为记录。 其中,这些关键字段中,打开时间和打开次数称为用户行为数据,程 序名称称为行为对象数据。
具体地,可以将关键字段作为用户行为矩阵的横坐标,用u表示, 行为对象作为用户行为矩阵的纵坐标,用v表示。根据关键字段统计用 户行为的发生频次,并根据发生频次更新用户行为矩阵中的频度值来 更新该用户行为矩阵,且该用户行为矩阵的基础单元符合泊松 (Poisson)分布:
Figure BDA0002550207540000111
其中,
Figure BDA0002550207540000121
表示第i个用户行为的行为画像;
Figure BDA0002550207540000122
表示第j个行为对象 的特征向量;
Figure BDA0002550207540000123
表示第i个用户行为的行为画像和第j个行为对象的 特征向量的的内积。
一个具体实施例中,给用户行为画像模型添加分组权重变量,该 分组权重变量包括:分组判别变量η和距离判别变量t,该分组权重变 量用于减小分组判别结果与设定分组的分组误差。其中,
Figure BDA0002550207540000124
其中,z是归一化系数;ρ0表示第t个分组对应的分组判别变量变 量的先验分布;ηt表示用户行为真实对应的分组判别变量;ηc表示第c 个分组对应的分组判别变量;M表示通过预设算法得到的用户分组的 数量,通过用户聚类结果自动判定;集合C表示用户行为分组类别的集 合,c是通过遍历所有的用户分组;
Figure BDA0002550207540000125
表示第c类对应的分类权重系数。
对添加分组权重变量后的用户行为画像模型进行初始化处理,通 过用户行为特征生成模块获得该用户的用户行为特征向量。然后根据 获得的用户行为特征向量,获得用户行为特征向量对应的分组判别结 果。
一个具体实施例中,对分组判别结果与设定分组进行分组误差计 算。通过采用基于概率的分类算法,对分组判别结果对应的第二标签 和设定分组对应的第一标签进行比较计算,并根据比较结果,确定分 组判别结果与设定分组的分组误差。其中,第一标签为设定分组中的 用户行为特征,第二标签为分组判别结果中的用户行为特征。例如, 第一标签包括:喜欢打游戏,且为益智类游戏,喜欢看宫廷剧等,第 二标签包括:喜欢打游戏,且为益智类游戏,喜欢看宫廷剧、偶像剧 等。
一个具体实施例中,获得分组误差计算结果,当该分组误差计算 结果小于预设误差值时,判定第一组别与第二组别一致,不需要调整 分组权重变量;当该分组误差计算结果不小于预设误差值时,判定第 一组别与第二组别不一致,需要重新调整分组权重变量,并在调整分 组权重变量后,重新获得调整后的用户行为特征向量。
另外,该分组误差计算还可以表示为:
Figure BDA0002550207540000131
其中,q表示行为矩阵重构时对无法进行计算的变量分布进行变分 变换后的近似分布,θ为分组判别变量对应的变量参数,
Figure BDA0002550207540000132
表示表示第 c类对应的分类权重系数,且CR(q(η,θ))越小,则说明该用户行为 画像模型越好。
一个具体实施例中,将用户行为特征向量和行为对象特征向量进 行矩阵重构生成用户行为矩阵,并计算能够生成用户行为矩阵的生成 概率。并计算该概率的对数,若对数值越大,则说明该用户行为画像 模型越好。
KL(q(η,θ)||p0(η,θ))-Εq(η)[logp(R|η)]
其中,p0表示行为矩阵重构变量对应的真实分布;q表示的是行为 矩阵重构时对无法进行计算的变量分布进行变分变换后的近似分布; R表示行为矩阵;KL(q(η,θ)||p0(η,θ))表示重构后的数据分布与用户真实 数据分布的分布差异,KL表示KL-离散度,是一种距离度量的方式; Εq(η)[logp(R|η)]表示在分组权重变量中分组判别变量η的条件下,用户 行为矩阵R出现的对数期望。
另外,该分组误差的计算可以在误差评估模块2031中完成,用户 行为矩阵的生成概率的计算可以在重构概率评估模块2032中完成。
步骤105,根据最小化模型方法,优化用户行为画像模型,更新用 户行为画像模型的用户行为分组变量参数、用户行为分布变量参数、 行为对象分组变量参数和行为对象分布变量参数。
一个具体实施例中,利用最小化模型方法对用户行为画像模型进 行评估,并对模型中的参数进行更新,对模型进行优化。该优化过程 是通过更新参数来最小化带有距离限制的目标函数来达到模型评估和 优化更新的目的。具体描述如下:
Figure BDA0002550207540000141
注:η表示分组判别变量,ρ0表示先验分布,q表示近似分布,R 表示行为矩阵,Ω表示重构矩阵分解模型变量设定的参数集合,Θ表 示分组判别变量设定的参数集合。
通过最小化模型方法能够学习具有分组可标识性的用户行为画 像,为此需要对模型中的变量进行逐一的更新,具体的更新流程如图3 所示:
步骤301,更新用户行为特征向量的基础单位。
具体地,对于用户行为矩阵的矩阵元素Rij,在k个不同的特征维 度上对用户行为的分布函数进行训练和更新,其中,用户行为特征向 量在第k维的值uik在训练时的分布更新如下:
Figure BDA0002550207540000142
其中,μk表示第j个用户行为其对应分组
Figure BDA0002550207540000143
下分组变量第k维 度的均值,δk表示第j个行为对象其对应分组
Figure BDA0002550207540000144
下分组变量第k维度 的方差,
Figure BDA0002550207540000145
表示第i用户行为其对应分组下分组
Figure BDA0002550207540000146
变量第k维度的 方差,
Figure BDA0002550207540000147
表示第i个用户行为属于第
Figure BDA0002550207540000148
个分组的概率,
Figure BDA0002550207540000149
表示 第j个行为对象属于第
Figure BDA00025502075400001410
组的概率。
步骤302,更新行为对象特征向量的基础单位。
具体地,对于用户行为矩阵的矩阵元素Rij,在k个不同的特征维 度上对行为对象的分布函数进行训练和更新,则行为对象特征向量在 第k维的值vij在训练时的分布更新如下:
Figure BDA0002550207540000151
其中,
Figure BDA0002550207540000152
表示第i个用户行为其对应分组
Figure BDA0002550207540000153
下分组变量第k维度 的均值,
Figure BDA0002550207540000154
表示第j个行为对象其对应分组
Figure BDA0002550207540000155
下分组变量第k维度 的方差,
Figure BDA0002550207540000156
表示第i用户行为其对应分组下分组
Figure BDA0002550207540000157
变量第k维度的 方差,
Figure BDA0002550207540000158
表示第i个用户行为属于第
Figure BDA0002550207540000159
个分组的概率,
Figure BDA00025502075400001510
表示第 j个行为对象属于第
Figure BDA00025502075400001511
组的概率。
步骤303,更新分组判别变量。
Figure RE-GDA00026695629800001512
Figure BDA00025502075400001513
其中,I表示分组数量的划分上限,一般情况会设定一个较大的值, 最大可设置为用户的数量;T表示用户行为分组的数量,通过聚类分析 获得。
其中,该公式是通过对分组判别变量分布似然函数对均值和方差 求偏导获得偏导结果,来有效的更新分组判别变量。
步骤304,更新用户行为分组变量参数。
Figure BDA00025502075400001514
Figure BDA00025502075400001515
步骤305,更新行为对象分组变量参数。
Figure BDA0002550207540000161
Figure BDA0002550207540000162
其中,N表示行为对象分组的数量,通过聚类分析获得;该公式 是通过对行为对象分组分布似然函数对形状参数和尺度参数求偏导, 来更新行为对象分组变量参数,其中,形状参数和尺度参数是数学中 通用化的名称。
步骤306,更新用户行为分布变量参数。
Figure BDA0002550207540000163
步骤307,更新行为对象分布变量参数。
Figure BDA0002550207540000164
步骤106,当更新后的用户行为画像模型的分组误差和生成概率之 和小于预设阈值时,用户行为画像模型构建成功,向构建成功的所述 用户行为画像模型输入所述用户行为数据,获得与所述用户行为数据 对应的用户行为画像。
一个具体实施例中,利用已经构建成功的用户行为画像模型,将 待识别用户的用户行为数据输入到该用户行为画像模型后,获得该用 户的用户行为画像。将获得的用户行为画像与画像库中对应的行为画 像进行距离判别,当判别距离小于预设距离值时,判定该待识别用户 认证成功。例如:
Figure BDA0002550207540000165
其中,uo表示画像库中的分组用户,uu为待识别用户,η为用户行 为画像分组判别时的权重,t为预设距离值。当判别函数ψ(uu,uo)的值 为1时,判定待识别用户合法;当判别函数ψ(uu,uo)的值为0时,判定待 识别用户非法。
又例如:
Figure BDA0002550207540000171
其中,
Figure BDA0002550207540000172
表示第i个用户的行为画像,ηt表示该用户的生成的分 组的判别权重,ηc标识该用户获得的分组的判别权重,
Figure BDA0002550207540000173
表 示用户的判别结果。当
Figure BDA0002550207540000174
的值为1时,判定待识别用户合法; 当
Figure BDA0002550207540000175
的值为0时,判定待识别用户非法。
通过用户行为画像模型对用户行为画像进行判别及认证,可以让 在线平台和运营商快速识别和发现非法用户。
一个具体实施例中,该训练成功的用户行为画像模型的一个具体 应用为:
获取待识别用户的用户行为数据,将该用户行为数据进行过滤和 矩阵生成操作,生成一个用户行为矩阵。将生成的用户行为矩阵输入 到用户行为画像模型中,输出具有细粒度判别性的用户行为画像,进 一步的,对该用户行为画像进行判别认证,将生成的用户行为画像在 画像库中进行距离判别,当距离判别结果小于预设距离值时,判定该 待识别用户认证成功。该模型能够更好的应用在服务平台中,使得商 家利用生成的用户行为画像进行个性化物品推荐或进行个性化服务 等。
本申请实施例提供的该方法,通过构建用户行为画像模型,对该 用户行为画像模型参数进行处理,生成用户行为特征向量和行为对象 特征向量,更好的获得用户的用户行为特征和行为对象特征,即获得 该用户所具有的各项特征。进一步地,对生成的用户行为特征向量进 行分组设定,获得设定分组,并和添加分组权重变量后获得的分组判 别结果进行分组误差计算,和,将生成的用户行为特征向量和行为对 象特征向量进行矩阵重构,并计算重构生成的行为矩阵为用户行为矩 阵的生成概率。通过添加分组权重变量参数,可以利用分组权重对不 同分组用户的行为画像作出明显的区分,使该用户行为画像模型生成 具有个性化和差异性的用户行为画像。再者,通过根据最小化模型方 法优化该用户行为画像模型,并更新该用户行为画像模型的用户行为 分组变量参数、用户行为分布变量参、行为对象分组变量参数和行为 对象分布变量参数,直至更新后的用户行为画像模型的分组误差和生 成概率之和小于预设阈值时,所述用户行为画像模型构建成功。此时 的用户行为画像模型可以生成待识别用户的具有普遍性的和个性化的 用户行为画像,且可以利用分组权重对不同分组用户的行为画像做出 明显的区分。进一步的,商家可以根据生成的用户行为画像的普遍性 特征进行用户商品推荐、好友发现等任务,同时可以利用用户行为画 像的个性化特性进行用户认证、商品精准推广、用户个性化服务等对 用户个体和群体具有偏向性的商业任务。
本申请还提供了一种用户行为画像的构建装置,该装置的具体实 施可参见方法实施例部分的描述,重复之处不再赘述,如图4所示, 该装置主要包括:
构建单元401,用于构建用户行为画像模型,其中,所述用户行为 画像模型包括:用户行为特征生成模块和行为对象特征生成模块,所 述用户行为特征生成模块包括用户行为分组变量参数和用户行为分布 变量参数,所述行为对象特征生成模块包括行为对象分组变量参数和 行为对象分布变量参数。
获得单元402,用于对用户行为分组变量参数和用户行为分布变量 参数初始化处理,获得用户行为分组分布参数,对行为对象分组变量 参数和行为对象分布变量参数初始化处理,获得行为对象分组分布参 数。
生成单元403,用于由用户行为特征生成模块根据用户行为分组分 布参数生成用户行为特征向量,由行为对象特征生成模块根据行为对 象分组分布参数生成行为对象特征向量。
判别单元404,对生成的用户行为特征向量进行分组设定,获得设 定分组,并计算分组判别结果与设定分组的分组误差,和,将用户行 为特征向量和行为对象特征向量重构生成行为矩阵,并计算重构生成 的行为矩阵为用户行为矩阵的生成概率,其中,分组判别结果为:给 所述用户行为画像模型添加分组权重变量后获得的分组,用户行为矩 阵通过用户行为数据构建得到。
更新单元405,用于根据最小化模型方法,优化所述用户行为画像 模型,更新所述用户行为画像模型的所述用户行为分组变量参数、所 述用户行为分布变量参、所述行为对象分组变量参数和所述行为对象 分布变量参数。
判定单元406,用于当更新后的所述用户行为画像模型的所述分组 误差和所述生成概率之和小于预设阈值时,所述用户行为画像模型构 建成功,向构建成功的用户行为画像模型输入用户行为数据,获得与 用户行为数据对应的用户行为画像。
基于同一构思,本申请实施例中还提供了一种电子设备,如图5 所示,该电子设备主要包括:处理器501、通信组件502、存储器503 和通信总线504,其中,处理器501、通信组件502和存储器503通过 通信总线504完成相互间的通信。其中,存储器503中存储有可被至处理器501执行的程序,处理器501执行存储器503中存储的程序, 实现如下步骤:构建用户行为画像模型,其中,用户行为画像模型包 括:用户行为特征生成模块和行为对象特征生成模块,用户行为特征 生成模块包括用户行为分组变量参数和用户行为分布变量参数,行为 对象特征生成模块包括行为对象分组变量参数和行为对象分布变量参 数;对用户行为分组变量参数和用户行为分布变量参数初始化处理, 获得用户行为分组分布参数,对行为对象分组变量参数和行为对象分 布变量参数初始化处理,获得行为对象分组分布参数;由用户行为特 征生成模块根据用户行为分组分布参数生成用户行为特征向量,由行 为对象特征生成模块根据行为对象分组分布参数生成行为对象特征向 量;对生成的用户行为特征向量进行分组设定,获得设定分组,并计 算分组判别结果与设定分组的分组误差,和,将用户行为特征向量和 行为对象特征向量重构生成行为矩阵,并计算重构生成的行为矩阵为 用户行为矩阵的生成概率,其中,分组判别结果为:给用户行为画像 模型添加分组权重变量后获得的分组,用户行为矩阵通过用户行为数 据构建得到;根据最小化模型方法,优化用户行为画像模型,更新用 户行为画像模型的用户行为分组变量参数、用户行为分布变量参、行 为对象分组变量参数和行为对象分布变量参数;当更新后的用户行为 画像模型的分组误差和生成概率之和小于预设阈值时,用户行为画像 模型构建成功,向构建成功的用户行为画像模型输入用户行为数据, 获得与用户行为数据对应的用户行为画像。
上述电子设备中提到的通信总线504可以是外设部件互连标准 (PeripheralComponent Interconnect,简称PCI)总线或扩展工业标准 结构(Extended IndustryStandard Architecture,简称EISA)总线等。该 通信总线504可以分为地址总线、数据总线、控制总线等。为便于表 示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型 的总线。
通信组件502用于上述电子设备与其他设备之间的通信。
存储器503可以包括随机存取存储器(Random Access Memory, 简称RAM),也可以包括非易失性存储器(non-volatile memory),例 如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离 前述处理器501的存储装置。
上述的处理器501可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称 NP)等,还可以是数字信号处理器(Digital Signal Processing,简称 DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称 ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称 FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立 硬件组件。
在本申请的又一实施例中,还提供了一种计算机可读存储介质, 该计算机可读存储介质中存储有计算机程序,当该计算机程序在计算 机上运行时,使得计算机执行上述实施例中所描述的用户行为画像模 型的构建方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者 其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机 程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。 在计算机上加载和执行该计算机指令时,全部或部分地产生按照本申 请实施例所述的流程或功能。该计算机可以时通用计算机、专用计算 机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算 机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机 可读存储介质传输,例如,计算机指令从一个网站站点、计算机、服 务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服 务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够 存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、 数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、 硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬 盘)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语 仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一 定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺 序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性 的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅 包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括 为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的 情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要 素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理 解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说 将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精 神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限 制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖 特点相一致的最宽的范围。

Claims (10)

1.一种用户行为画像的构建方法,其特征在于,所述方法包括:
构建用户行为画像模型,其中,所述用户行为画像模型包括:用户行为特征生成模块和行为对象特征生成模块,所述用户行为特征生成模块包括用户行为分组变量参数和用户行为分布变量参数,所述行为对象特征生成模块包括行为对象分组变量参数和行为对象分布变量参数;
对所述用户行为分组变量参数和所述用户行为分布变量参数初始化处理,获得用户行为分组分布参数,对所述行为对象分组变量参数和所述行为对象分布变量参数初始化处理,获得行为对象分组分布参数;
由所述用户行为特征生成模块根据所述用户行为分组分布参数生成用户行为特征向量,由所述行为对象特征生成模块根据所述行为对象分组分布参数生成行为对象特征向量;
对生成的所述用户行为特征向量进行分组设定,获得设定分组,并计算分组判别结果与所述设定分组的分组误差,和,将所述用户行为特征向量和所述行为对象特征向量重构生成行为矩阵,并计算所述重构生成的所述行为矩阵为用户行为矩阵的生成概率,其中,所述分组判别结果为:给所述用户行为画像模型添加分组权重变量后获得的分组,所述用户行为矩阵通过用户行为数据构建得到;
根据最小化模型方法,优化所述用户行为画像模型,更新所述用户行为画像模型的所述用户行为分组变量参数、所述用户行为分布变量参、所述行为对象分组变量参数和所述行为对象分布变量参数;
当更新后的所述用户行为画像模型的所述分组误差和所述生成概率之和小于预设阈值时,所述用户行为画像模型构建成功,向构建成功的所述用户行为画像模型输入所述用户行为数据,获得与所述用户行为数据对应的用户行为画像。
2.根据权利要求1所述的用户行为画像的构建方法,其特征在于,构建用户行为画像模型之前,还包括:
获取所述用户的用户行为数据;
提取所述用户行为数据的关键字段,构建用户行为记录,其中,所述关键字段包括:唯一标识、行为对象和发生时间;
遍历所述用户行为记录,滤除所述关键字段缺失的所述用户行为记录,并根据滤除后的所述用户行为记录的所述关键字段构建所述用户行为矩阵;
根据所述关键字段,统计用户行为的发生频次,并采用所述发生频次更新所述用户行为矩阵中对应的频度值。
3.根据权利要求2所述的用户行为画像的构建方法,其特征在于,对所述用户行为分组变量参数和所述用户行为分布变量参数初始化处理,获得用户行为分组分布参数之后,还包括:
给所述用户行为画像模型添加所述分组权重变量,所述分组权重变量用于减小所述分组判别结果与所述设定分组的所述分组误差;
对添加所述分组权重变量后的用户行为画像模型进行初始化处理,通过所述用户行为特征生成模块获得所述用户行为特征向量;
根据所述获得的用户行为特征向量,获得所述用户行为特征向量对应的分组判别结果。
4.根据权利要求1所述的用户行为画像的构建方法,其特征在于,由所述用户行为特征生成模块根据所述用户行为分组分布参数生成用户行为特征向量,包括:
由所述用户行为特征生成模块根据所述用户行为分组变量参数生成所述用户行为特征向量的分组划分概率;
选择所述分组划分概率大于预设概率值的分组划分概率所对应的组别;
根据所述组别,生成所述组别对应的用户行为特征向量。
5.根据权利要求4所述的用户行为画像的构建方法,其特征在于,计算分组判别结果与所述设定分组的分组误差,包括:
通过基于概率的分类算法,对所述分组判别结果对应的第二标签和所述设定分组对应的第一标签进行比较计算;
根据比较结果,确定所述分组判别结果与所述设定分组的分组误差;
其中,所述第一标签为所述设定分组中的用户行为特征,所述第二标签为所述分组判别结果中的用户行为特征。
6.根据权利要求5所述的用户行为画像的构建方法,其特征在于,计算所述分组判别结果与所述设定分组的分组误差之后,还包括:
获得分组误差计算结果;
当所述分组误差计算结果小于预设误差值时,不调整所述分组权重变量;
当所述分组误差计算结果不小于预设误差值时,调整所述分组权重变量,并在调整所述分组权重变量后,获得调整后的所述用户行为特征向量。
7.根据权利要求1-6任一项所述的用户行为画像的构建方法,其特征在于,向构建成功的所述用户行为画像模型输入所述用户行为数据,获得与所述用户行为数据对应的用户行为画像之后,还包括:
通过构建成功的所述用户行为画像模型获得待识别用户的用户行为画像;
将所述获得的待识别用户的用户行为画像在画像库中进行距离判别;
当距离判别结果小于预设距离值时,判定所述待识别用户认证成功。
8.一种用户行为画像的构建装置,其特征在于,包括:
构建单元,用于构建用户行为画像模型,其中,所述用户行为画像模型包括:用户行为特征生成模块和行为对象特征生成模块,所述用户行为特征生成模块包括用户行为分组变量参数和用户行为分布变量参数,所述行为对象特征生成模块包括行为对象分组变量参数和行为对象分布变量参数;
获得单元,用于对所述用户行为分组变量参数和所述用户行为分布变量参数初始化处理,获得用户行为分组分布参数,对所述行为对象分组变量参数和所述行为对象分布变量参数初始化处理,获得行为对象分组分布参数;
生成单元,用于由所述用户行为特征生成模块根据所述用户行为分组分布参数生成用户行为特征向量,由所述行为对象特征生成模块根据所述行为对象分组分布参数生成行为对象特征向量;
判别单元,用于对生成的所述用户行为特征向量进行分组设定,获得设定分组,并计算分组判别结果与所述设定分组的分组误差,和,将所述用户行为特征向量和所述行为对象特征向量重构生成行为矩阵,并计算所述重构生成的行为矩阵为用户行为矩阵的生成概率,其中,所述分组判别结果为:给所述用户行为画像模型添加分组权重变量后获得的分组,所述用户行为矩阵通过用户行为数据构建得到;
更新单元,用于根据最小化模型方法,优化所述用户行为画像模型,更新所述用户行为画像模型的所述用户行为分组变量参数、所述用户行为分布变量参、所述行为对象分组变量参数和所述行为对象分布变量参数;
判定单元,用于当更新后的所述用户行为画像模型的所述分组误差和所述生成概率之和小于预设阈值时,所述用户行为画像模型构建成功,向构建成功的所述用户行为画像模型输入所述用户行为数据,获得与所述用户行为数据对应的用户行为画像。
9.一种电子设备,其特征在于,包括:处理器、通信组件、存储器和通信总线,其中,处理器、通信组件和存储器通过通信总线完成相互间的通信;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器中所存储的程序,实现权利要求1-7任一项所述的用户行为画像的构建方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的用户行为画像的构建方法。
CN202010573448.8A 2020-06-22 2020-06-22 用户行为画像的构建方法、装置、设备及存储介质 Active CN111861545B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010573448.8A CN111861545B (zh) 2020-06-22 2020-06-22 用户行为画像的构建方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010573448.8A CN111861545B (zh) 2020-06-22 2020-06-22 用户行为画像的构建方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111861545A true CN111861545A (zh) 2020-10-30
CN111861545B CN111861545B (zh) 2022-10-18

Family

ID=72987121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010573448.8A Active CN111861545B (zh) 2020-06-22 2020-06-22 用户行为画像的构建方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111861545B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113886670A (zh) * 2021-12-06 2022-01-04 中国电子科技集团公司第三十研究所 一种基于标注体系的暗网站点用户画像方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016024739A (ja) * 2014-07-23 2016-02-08 株式会社ソニー・コンピュータエンタテインメント 情報処理装置
CN107730289A (zh) * 2016-08-11 2018-02-23 株式会社理光 一种用户行为分析方法及用户行为分析装置
CN110544109A (zh) * 2019-07-25 2019-12-06 深圳壹账通智能科技有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN110674144A (zh) * 2019-08-14 2020-01-10 深圳壹账通智能科技有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN110781930A (zh) * 2019-10-14 2020-02-11 西安交通大学 一种基于网络安全设备日志数据的用户画像分组及行为分析方法和系统
CN111222563A (zh) * 2020-01-02 2020-06-02 腾讯科技(深圳)有限公司 一种模型训练方法、数据获取方法以及相关装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016024739A (ja) * 2014-07-23 2016-02-08 株式会社ソニー・コンピュータエンタテインメント 情報処理装置
CN107730289A (zh) * 2016-08-11 2018-02-23 株式会社理光 一种用户行为分析方法及用户行为分析装置
CN110544109A (zh) * 2019-07-25 2019-12-06 深圳壹账通智能科技有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN110674144A (zh) * 2019-08-14 2020-01-10 深圳壹账通智能科技有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN110781930A (zh) * 2019-10-14 2020-02-11 西安交通大学 一种基于网络安全设备日志数据的用户画像分组及行为分析方法和系统
CN111222563A (zh) * 2020-01-02 2020-06-02 腾讯科技(深圳)有限公司 一种模型训练方法、数据获取方法以及相关装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113886670A (zh) * 2021-12-06 2022-01-04 中国电子科技集团公司第三十研究所 一种基于标注体系的暗网站点用户画像方法

Also Published As

Publication number Publication date
CN111861545B (zh) 2022-10-18

Similar Documents

Publication Publication Date Title
CN107341716B (zh) 一种恶意订单识别的方法、装置及电子设备
CN113468227B (zh) 基于图神经网络的信息推荐方法、系统、设备和存储介质
CN106897404B (zh) 一种基于多gru层神经网络的推荐方法与系统
CN109840413B (zh) 一种钓鱼网站检测方法及装置
CN108985190B (zh) 目标识别方法和装置、电子设备、存储介质
CN111431849B (zh) 一种网络入侵检测方法及装置
CN111275205A (zh) 虚拟样本的生成方法、终端设备及存储介质
CN111310743B (zh) 人脸识别方法、装置、电子设备及可读存储介质
CN112784168A (zh) 信息推送模型训练方法以及装置、信息推送方法以及装置
WO2023024408A1 (zh) 用户特征向量确定方法、相关设备及介质
CN110111311B (zh) 一种图像质量评价方法和装置
CN111861545B (zh) 用户行为画像的构建方法、装置、设备及存储介质
CN114139593A (zh) 一种去偏差图神经网络的训练方法、装置和电子设备
CN110929285B (zh) 一种隐私数据的处理方法及装置
CN111245815B (zh) 数据处理方法、装置、存储介质及电子设备
CN115204322B (zh) 行为链路异常识别方法和装置
CN113076487B (zh) 一种用户兴趣表征及内容推荐方法、装置和设备
CN113259369B (zh) 一种基于机器学习成员推断攻击的数据集认证方法及系统
CN112463964B (zh) 文本分类及模型训练方法、装置、设备及存储介质
CN111984867B (zh) 一种网络资源确定方法及装置
CN110874600B (zh) 基于机器学习的离子束溅射沉积薄膜凹坑与颗粒判别方法
CN112612955A (zh) 基于深度学习的产品推送方法及系统
CN117540791B (zh) 一种对抗训练的方法及装置
CN116501993B (zh) 房源数据推荐方法及装置
CN117237788B (zh) 图像处理方法、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant