CN115994267B - 实时用户画像刻画方法、装置、计算机设备和存储介质 - Google Patents

实时用户画像刻画方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN115994267B
CN115994267B CN202310117849.6A CN202310117849A CN115994267B CN 115994267 B CN115994267 B CN 115994267B CN 202310117849 A CN202310117849 A CN 202310117849A CN 115994267 B CN115994267 B CN 115994267B
Authority
CN
China
Prior art keywords
user
data
new behavior
real
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310117849.6A
Other languages
English (en)
Other versions
CN115994267A (zh
Inventor
王绪刚
朱润龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Oula Cognitive Intelligent Technology Co ltd
Original Assignee
Beijing Oula Cognitive Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Oula Cognitive Intelligent Technology Co ltd filed Critical Beijing Oula Cognitive Intelligent Technology Co ltd
Priority to CN202310117849.6A priority Critical patent/CN115994267B/zh
Publication of CN115994267A publication Critical patent/CN115994267A/zh
Application granted granted Critical
Publication of CN115994267B publication Critical patent/CN115994267B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种实时用户画像刻画方法、装置、计算机设备和存储介质,涉及用户画像技术领域;该方法包括:获取全体用户的行为数据和产品数据;对行为数据和产品数据进行存储和梳理,形成初始数据图谱;基于初始数据图谱的图游走算法,获取与用户A相关联的用户群组B;获取用户A的新行为特征,从用户群组B中筛选具有该新行为特征所对应标签的用户群组B’;基于用户群组B’中每个用户对应该新行为特征的标签值得分,计算用户A对应该新行为特征的标签值得分;判断用户A的该标签值得分是否大于阈值;若大于阈值,则用户A拥有该新行为特征所对应的标签。本发明基于图游走算法可实时计算用户画像,减少信息的滞后性,可发挥数据的最大价值。

Description

实时用户画像刻画方法、装置、计算机设备和存储介质
技术领域
本发明涉及用户画像技术领域,具体涉及一种基于图的实时用户画像刻画方法、装置、计算机设备和存储介质。
背景技术
在数字化的今天,越来越多的企业将以产品为中心的组织方式转型为以用户为核心目标的组织方式,“用户画像”是全方面刻画目标客户模型的标签化的用户模型。
传统的用户画像刻画方法,一般采用离线刻画;传统用户画像的刻画,往往由于计算量巨大,刻画方式具有一定的滞后性,尤其是“兴趣”标签的刻画,往往由于计算的滞后性,无法发挥数据的最大价值。
发明内容
针对现有技术中存在的不足之处,本发明提供一种基于图的实时用户画像刻画方法、装置、计算机设备和存储介质。
本发明第一目的在于提供一种实时用户画像刻画方法,包括:
获取全体用户的行为数据和产品数据;
对所述行为数据和产品数据进行存储和梳理,形成初始数据图谱;
基于所述初始数据图谱的图游走算法,获取与用户A相关联的用户群组B;
获取用户A的新行为特征,从所述用户群组B中筛选具有该新行为特征所对应标签的用户群组B’;
基于所述用户群组B’中每个用户对应该新行为特征的标签值得分,计算用户A对应该新行为特征的标签值得分;
判断用户A的该标签值得分是否大于阈值;若大于阈值,则用户A拥有该新行为特征所对应的标签。
作为本发明的进一步改进,所述产品数据包括但不限于游戏类产品和母婴类产品,所述行为数据包括但不限于购买、浏览和点击中的至少一种。
作为本发明的进一步改进,所述基于所述初始数据图谱的图游走算法,获取与用户A相关联的用户群组B;包括:
基于所述初始数据图谱的图游走算法获取用户A产生行为数据的商品组;
获取与所述商品组中每个商品产生行为数据的用户,构成与用户A相关联的用户群组B。
作为本发明的进一步改进,用户群组B’中每个用户的标签值得分为“购买”该类商品行为数量。
作为本发明的进一步改进,用户A对应该新行为特征的标签值得分为:
Ai=B1i/X1*W1+B2i/X2*W2+···+Bni/Xn*Wn
式中,Ai为用户A的第i个标签的标签值得分,n为用户群组B’的用户数量,Bni为第n个用户的第i个标签的标签值得分;Xn为第一行为数据的整体用户量,第一行为数据为第n个用户与用户A关联商品的行为数据;W为第一行为数据的权重。
作为本发明的进一步改进,阈值为50。
作为本发明的进一步改进,若不大于阈值,则用户A不拥有该新行为特征所对应的标签。
本发明的第二目的在于提供一种实时用户画像刻画装置,用于实现上述实时用户画像刻画方法,包括:
获取模块,用于获取全体用户的行为数据和产品数据;
初始数据图谱形成模块,用于对所述行为数据和产品数据进行存储和梳理,形成初始数据图谱;
查询模块,用于基于所述初始数据图谱的图游走算法,获取与用户A相关联的用户群组B;
筛选模块,用于获取用户A的新行为特征,从所述用户群组B中筛选具有该新行为特征所对应标签的用户群组B’;
计算模块,用于基于所述用户群组B’中每个用户对应该新行为特征的标签值得分,计算用户A对应该新行为特征的标签值得分;
判断模块,用于判断用户A的该标签值得分是否大于阈值;若大于阈值,则用户A拥有该新行为特征所对应的标签。
本发明的第三目的在于提供一种计算机设备,包括:存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述实时用户画像刻画方法的步骤。
本发明的第四目的在于提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述实时用户画像刻画方法的步骤。
与现有技术相比,本发明的有益效果为:
本发明基于图游走算法可实时计算用户画像,减少信息的滞后性,可发挥数据的最大价值。
附图说明
图1为本发明实时用户画像刻画方法的流程图;
图2为实施例1的初始数据图谱的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图对本发明做进一步的详细描述:
如图1所示,本发明提供一种实时用户画像刻画方法,包括:
S1、获取全体用户的行为数据和产品数据;其中,产品数据包括但不限于游戏类产品和母婴类产品,行为数据包括但不限于购买、浏览和点击中的至少一种。
S2、对行为数据和产品数据进行存储和梳理,形成初始数据图谱;其中,作为一种实施例,初始数据图谱如图2所示。
S3、基于初始数据图谱的图游走算法,获取与用户A相关联的用户群组B;具体包括:基于初始数据图谱的图游走算法获取用户A产生行为数据的商品组;获取与商品组中每个商品产生行为数据的用户,构成与用户A相关联的用户群组B。
S4、获取用户A的新行为特征,从用户群组B中筛选具有该新行为特征所对应标签的用户群组B’。
S5、基于用户群组B’中每个用户对应该新行为特征的标签值得分,计算用户A对应该新行为特征的标签值得分;其中,
用户群组B’中每个用户的标签值得分为“购买”该类商品行为数量;
用户A对应该新行为特征的标签值得分为:
Ai=B1i/X1*W1+B2i/X2*W2+···+Bni/Xn*Wn
式中,Ai为用户A的第i个标签的标签值得分,n为用户群组B’的用户数量,Bni为第n个用户的第i个标签的标签值得分;Xn为第一行为数据的整体用户量,第一行为数据为第n个用户与用户A关联商品的行为数据;W为第一行为数据的权重。
S6、判断用户A的该标签值得分是否大于阈值;若大于阈值,则用户A拥有该新行为特征所对应的标签;其中,
优选阈值为50,若标签值得分大于50,则用户A拥有该新行为特征所对应的标签;若不大于50,则用户A不拥有该新行为特征所对应的标签。
实施例1:
基于图2所示的初始数据图谱,计算用户A的“游戏”标签值得分,并判断其是否拥有该“游戏”标签;具体包括:
用户A购买了商品E,获取与用户A相关联的用户群组B,包含用户B1、B2和B3;从用户群组B中筛选带有“游戏”标签的用户群组B’,包含用户B1和B3;
用户A的标签值得分=用户B1游戏标签值分值/购买关系的整体用户量*购买关系权重+用户B3游戏标签值分值/点击关系的整体用户量*点击关系权重;
判断用户A的标签值是否大于50,若大于50,则判断用户A拥有“游戏”标签。
在一个实施例中,提供了一种实时用户画像刻画装置,包括:
获取模块,用于实现上述S1;
初始数据图谱形成模块,用于实现上述S2;
查询模块,用于实现上述S3;
筛选模块,用于实现上述S4;
计算模块,用于实现上述S5;
判断模块,用于实现上述S6。
在一个实施例中,提供了一种计算机设备,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据,该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现如上的一种实时用户画像刻画方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时可以实现如上实时用户画像刻画方法中的任一步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种实时用户画像刻画方法,其特征在于,包括:
获取全体用户的行为数据和产品数据;
对所述行为数据和产品数据进行存储和梳理,形成初始数据图谱;
基于所述初始数据图谱的图游走算法,获取与用户A相关联的用户群组B;
获取用户A的新行为特征,从所述用户群组B中筛选具有该新行为特征所对应标签的用户群组B’;
基于所述用户群组B’中每个用户对应该新行为特征的标签值得分,计算用户A对应该新行为特征的标签值得分;
判断用户A的该标签值得分是否大于阈值;若大于阈值,则用户A拥有该新行为特征所对应的标签。
2.如权利要求1所述的实时用户画像刻画方法,其特征在于,所述产品数据包括但不限于游戏类产品和母婴类产品,所述行为数据包括但不限于购买、浏览和点击中的至少一种。
3.如权利要求1所述的实时用户画像刻画方法,其特征在于,所述基于所述初始数据图谱的图游走算法,获取与用户A相关联的用户群组B;包括:
基于所述初始数据图谱的图游走算法获取用户A产生行为数据的商品组;
获取与所述商品组中每个商品产生行为数据的用户,构成与用户A相关联的用户群组B。
4.如权利要求1所述的实时用户画像刻画方法,其特征在于,用户群组B’中每个用户的标签值得分为“购买”该类商品行为数量。
5.如权利要求1所述的实时用户画像刻画方法,其特征在于,用户A对应该新行为特征的标签值得分为:
Ai=B1i/X1*W1+B2i/X2*W2+···+Bni/Xn*Wn
式中,Ai为用户A的第i个标签的标签值得分,n为用户群组B’的用户数量,Bni为第n个用户的第i个标签的标签值得分;Xn为第一行为数据的整体用户量,第一行为数据为第n个用户与用户A关联商品的行为数据;W为第一行为数据的权重。
6.如权利要求1所述的实时用户画像刻画方法,其特征在于,阈值为50。
7.如权利要求1所述的实时用户画像刻画方法,其特征在于,若不大于阈值,则用户A不拥有该新行为特征所对应的标签。
8.一种实时用户画像刻画装置,用于实现如权利要求1~7中任一项所述的实时用户画像刻画方法,其特征在于,包括:
获取模块,用于获取全体用户的行为数据和产品数据;
初始数据图谱形成模块,用于对所述行为数据和产品数据进行存储和梳理,形成初始数据图谱;
查询模块,用于基于所述初始数据图谱的图游走算法,获取与用户A相关联的用户群组B;
筛选模块,用于获取用户A的新行为特征,从所述用户群组B中筛选具有该新行为特征所对应标签的用户群组B’;
计算模块,用于基于所述用户群组B’中每个用户对应该新行为特征的标签值得分,计算用户A对应该新行为特征的标签值得分;
判断模块,用于判断用户A的该标签值得分是否大于阈值;若大于阈值,则用户A拥有该新行为特征所对应的标签。
9.一种计算机设备,包括:存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~7中任一项所述的实时用户画像刻画方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~7中任一项所述的实时用户画像刻画方法的步骤。
CN202310117849.6A 2023-02-15 2023-02-15 实时用户画像刻画方法、装置、计算机设备和存储介质 Active CN115994267B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310117849.6A CN115994267B (zh) 2023-02-15 2023-02-15 实时用户画像刻画方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310117849.6A CN115994267B (zh) 2023-02-15 2023-02-15 实时用户画像刻画方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN115994267A CN115994267A (zh) 2023-04-21
CN115994267B true CN115994267B (zh) 2023-09-05

Family

ID=85993439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310117849.6A Active CN115994267B (zh) 2023-02-15 2023-02-15 实时用户画像刻画方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN115994267B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339421A (zh) * 2016-08-15 2017-01-18 北京集奥聚合科技有限公司 一种用户浏览行为的兴趣挖掘方法
CN109040329A (zh) * 2018-06-11 2018-12-18 平安科技(深圳)有限公司 联系人标签的确定方法、终端设备及介质
CN110209931A (zh) * 2019-05-17 2019-09-06 腾讯科技(深圳)有限公司 媒体内容的推送方法和装置、存储介质、电子装置
CN112256973A (zh) * 2020-11-04 2021-01-22 贝壳技术有限公司 用户画像修正方法、装置、介质和电子设备
CN114493642A (zh) * 2020-11-12 2022-05-13 中国移动通信集团浙江有限公司 用户画像标签生成方法、装置、计算设备及存储介质
CN115017409A (zh) * 2022-05-27 2022-09-06 平安银行股份有限公司 故障解决指引的生成方法、装置、设备及存储介质
CN115048583A (zh) * 2022-06-29 2022-09-13 中国平安财产保险股份有限公司 基于用户画像的信息推送方法、系统、设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8230338B2 (en) * 2008-01-21 2012-07-24 International Business Machines Corporation Game determination of tag relevance for social bookmarking

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339421A (zh) * 2016-08-15 2017-01-18 北京集奥聚合科技有限公司 一种用户浏览行为的兴趣挖掘方法
CN109040329A (zh) * 2018-06-11 2018-12-18 平安科技(深圳)有限公司 联系人标签的确定方法、终端设备及介质
CN110209931A (zh) * 2019-05-17 2019-09-06 腾讯科技(深圳)有限公司 媒体内容的推送方法和装置、存储介质、电子装置
CN112256973A (zh) * 2020-11-04 2021-01-22 贝壳技术有限公司 用户画像修正方法、装置、介质和电子设备
CN114493642A (zh) * 2020-11-12 2022-05-13 中国移动通信集团浙江有限公司 用户画像标签生成方法、装置、计算设备及存储介质
CN115017409A (zh) * 2022-05-27 2022-09-06 平安银行股份有限公司 故障解决指引的生成方法、装置、设备及存储介质
CN115048583A (zh) * 2022-06-29 2022-09-13 中国平安财产保险股份有限公司 基于用户画像的信息推送方法、系统、设备及存储介质

Also Published As

Publication number Publication date
CN115994267A (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
US20220198289A1 (en) Recommendation model training method, selection probability prediction method, and apparatus
CN108399383B (zh) 表情迁移方法、装置存储介质及程序
CN109102127B (zh) 商品推荐方法及装置
CN109961357B (zh) 用户数据处理方法、装置、电子设备及存储介质
WO2019085327A1 (zh) 电子装置、产品推荐方法、系统和计算机可读存储介质
CN111325353A (zh) 训练数据集的贡献度计算方法、装置、设备及存储介质
US20230281665A1 (en) Systems and methods for targeting bid and position for a keyword
WO2020221022A1 (zh) 业务对象推荐方法
Xue et al. Pricing personalized bundles: A new approach and an empirical study
US20220129740A1 (en) Convolutional neural networks with soft kernel selection
CN109409739B (zh) 一种基于pomdp模型的众包平台任务分配方法
US20170076299A1 (en) Extracting relevant features from electronic marketing data for training analytical models
CN110889725B (zh) 在线广告ctr预估方法、装置、设备及存储介质
CN113627411A (zh) 一种基于超分辨率的商品识别与价格匹配方法及系统
CN111144933A (zh) 商品推荐方法、装置、电子设备及存储介质
JP2021503123A (ja) ビデオ要約生成方法及び装置、電子機器並びにコンピュータ記憶媒体
CN111260449A (zh) 一种模型训练的方法、商品推荐的方法、装置及存储介质
CN110457361B (zh) 特征数据获取方法、装置、计算机设备和存储介质
CN105630185B (zh) 显示广告预测中的时间动态
CN115994267B (zh) 实时用户画像刻画方法、装置、计算机设备和存储介质
CN111444447A (zh) 内容推荐页面的展现方法及装置
US20180225767A1 (en) Investment management proposal system
CN112990583A (zh) 一种数据预测模型的入模特征确定方法及设备
US20140324852A1 (en) Classifying Queries To Generate Category Mappings
JP2023029604A (ja) 特許情報処理装置、特許情報処理方法、およびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant