CN113396433B - 用户画像构建方法及相关产品 - Google Patents
用户画像构建方法及相关产品 Download PDFInfo
- Publication number
- CN113396433B CN113396433B CN201980091306.3A CN201980091306A CN113396433B CN 113396433 B CN113396433 B CN 113396433B CN 201980091306 A CN201980091306 A CN 201980091306A CN 113396433 B CN113396433 B CN 113396433B
- Authority
- CN
- China
- Prior art keywords
- feature
- application
- relation
- pairs
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims description 22
- 238000004891 communication Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000009182 swimming Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- AMGQUBHHOARCQH-UHFFFAOYSA-N indium;oxotin Chemical compound [In].[Sn]=O AMGQUBHHOARCQH-UHFFFAOYSA-N 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种用户画像构建方法及相关产品,该方法包括:获取目标对象针对多个应用的多个应用数据,根据多个应用数据形成应用ID之间的关系对,得到多个关系对,根据多个关系对构建用户画像,如此,可基于多个应用的应用ID维度构建多个应用之间的关系,然后基于多个应用之间的关系构建更加完整的用户画像,使用户画像更加完整、准确,使得用户画像的构建更加智能。
Description
技术领域
本申请涉及电子技术领域,具体涉及一种用户画像构建方法及相关产品。
背景技术
用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。随着大数据处理技术的发展,为了更好地进行各类产品的营销,对用户构建用户画像的场景越来越多。
随着电子设备(如:手机、平板电脑等)的大量普及应用,电子设备能够支持的应用越来越多,功能越来越强大,电子设备向着多样化、个性化的方向发展,成为用户生活中不可缺少的电子用品。考虑到手机等电子设备的使用越来越普及,发明人提出基于用户对电子设备的使用为用户构建用户画像。
发明内容
本申请实施例提供了一种用户画像构建方法及相关产品,能够基于多个应用的应用ID维度构建更加完整的用户画像。
第一方面,本申请实施例提供一种用户画像构建方法,应用于电子设备,所述方法包括:
获取目标对象针对多个应用的多个应用数据,所述多个应用与所述多个应用数据一一对应,所述多个应用数据中每一应用数据对应一个应用ID;
根据所述多个应用数据形成应用ID之间的关系对,得到多个关系对,每一所述关系对为两个应用ID的关系对;
根据所述多个关系对构建用户画像。
第二方面,本申请实施例提供了一种用户画像构建装置,应用于电子设备,所述用户画像构建装置包括:
获取单元,用于获取目标对象针对多个应用的多个应用数据,所述多个应用与所述多个应用数据一一对应,所述多个应用数据中每一应用数据对应一个应用ID;
处理单元,用于根据所述多个应用数据形成应用ID之间的关系对,得到多个关系对,每一所述关系对为两个应用ID的关系对;
构建单元,用于根据所述多个关系对构建用户画像。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口,以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,本申请实施例中所描述的用户画像构建方法及相关产品,通过获取目标对象针对多个应用的多个应用数据,根据多个应用数据形成应用ID之间的关系对,得到多个关系对,根据多个关系对构建用户画像,如此,可基于多个应用的应用ID维度构建多个应用之间的关系,然后基于多个应用之间的关系构建更加完整的用户画像,使用户画像更加完整、准确,使得用户画像的构建更加智能。
附图说明
下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是本申请实施例提供的一种电子设备的结构示意图;
图1B是本申请实施例提供的一种用户画像构建方法的流程示意图;
图1C是本申请实施例提供的多个应用ID中每一应用ID对应的特征标签集的演示示意图;
图1D是本申请实施例提供的一种根据预设规则将多个特征标签集中具有相同特征标签的应用ID形成关系对的演示示意图;
图1E是本申请实施例提供的一种将所述多个特征标签集中时序特征标签相同的应用ID形成时序关系对的演示示意图;
图1F是本申请实施例提供的一种将多个所述多个关系对进行连接的演示示意图;
图1G是本申请实施例提供的一种构建用户画像的演示示意图
图2是本申请实施例公开的另一种用户画像构建方法的流程示意图;
图3是本申请实施例公开的另一种用户画像构建方法的流程示意图;
图4是本申请实施例公开的另一种电子设备的结构示意图;
图5是本申请实施例公开的一种用户画像构建装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例所涉及到的电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(user equipment,UE),移动台(mobile station,MS),终端设备(terminaldevice)等等。为方便描述,上面提到的设备统称为电子设备。下面对本申请实施例进行详细介绍。
请参阅图1A,图1A是本申请实施例公开的一种电子设备的结构示意图,电子设备100可以包括控制电路,该控制电路可以包括存储和处理电路110。该存储和处理电路110可以存储器,例如硬盘驱动存储器,非易失性存储器(例如闪存或用于形成固态驱动器的其它电子可编程只读存储器等),易失性存储器(例如静态或动态随机存取存储器等)等,本申请实施例不作限制。存储和处理电路110中的处理电路可以用于控制电子设备100的运转。该处理电路可以基于一个或多个微处理器,微控制器,数字主从耳机切换控制器,基带处理器,功率管理单元,音频编解码器芯片,专用集成电路,显示驱动器集成电路等来实现。
存储和处理电路110可用于运行电子设备100中的软件,例如互联网浏览应用程序,互联网协议语音(voice over internet protocol,VOIP)电话呼叫应用程序,电子邮件应用程序,媒体播放应用程序,操作系统功能等。这些软件可以用于执行一些控制操作,例如,基于照相机的图像采集,基于环境光传感器的环境光测量,基于接近传感器的接近传感器测量,基于诸如发光二极管的状态指示灯等状态指示器实现的信息显示功能,基于触摸传感器的触摸事件检测,与在多个(例如分层的)显示器上显示信息相关联的功能,与执行无线通信功能相关联的操作,与收集和产生音频信号相关联的操作,与收集和处理按钮按压事件数据相关联的控制操作,以及电子设备100中其它功能等,本申请实施例不作限制。
电子设备100还可以包括输入-输出电路150。输入-输出电路150可用于使电子设备100实现数据的输入和输出,即允许电子设备100从外部设备接收数据和也允许电子设备100将数据从电子设备100输出至外部设备。输入-输出电路150可以进一步包括传感器170。传感器170可以包括环境光传感器,基于光和电容的接近传感器,触摸传感器(例如,基于光触摸传感器和/或电容式触摸传感器,其中,触摸传感器可以是触控显示屏的一部分,也可以作为一个触摸传感器结构独立使用),加速度传感器,重力传感器,和其它传感器等。
输入-输出电路150还可以包括一个或多个显示器,例如显示器130。显示器130可以包括液晶显示器,有机发光二极管显示器,电子墨水显示器,等离子显示器,使用其它显示技术的显示器中一种或者几种的组合。显示器130可以包括触摸传感器阵列(即,显示器130可以是触控显示屏)。触摸传感器可以是由透明的触摸传感器电极(例如氧化铟锡(ITO)电极)阵列形成的电容式触摸传感器,或者可以是使用其它触摸技术形成的触摸传感器,例如音波触控,压敏触摸,电阻触摸,光学触摸等,本申请实施例不作限制。
音频组件140可以用于为电子设备100提供音频输入和输出功能。电子设备100中的音频组件140可以包括扬声器,麦克风,蜂鸣器,音调发生器以及其它用于产生和检测声音的组件。
通信电路120可以用于为电子设备100提供与外部设备通信的能力。通信电路120可以包括模拟和数字输入-输出接口电路,和基于射频信号和/或光信号的无线通信电路。通信电路120中的无线通信电路可以包括射频收发器电路、功率放大器电路、低噪声放大器、开关、滤波器和天线。举例来说,通信电路120中的无线通信电路可以包括用于通过发射和接收近场耦合电磁信号来支持近场通信(near field communication,NFC)的电路。例如,通信电路120可以包括近场通信天线和近场通信收发器。通信电路120还可以包括蜂窝电话收发器和天线,无线局域网收发器电路和天线等。
电子设备100还可以进一步包括电池,电力管理电路和其它输入-输出单元160。输入-输出单元160可以包括按钮,操纵杆,点击轮,滚动轮,触摸板,小键盘,键盘,照相机,发光二极管和其它状态指示器等。
用户可以通过输入-输出电路150输入命令来控制电子设备100的操作,并且可以使用输入-输出电路150的输出数据以实现接收来自电子设备100的状态信息和其它输出。
请参阅图1B,图1B是本申请实施例提供的一种用户画像构建方法的流程示意图,本实施例中所描述的用户画像构建方法,应用于如图1A的电子设备,该用户画像构建方法包括:
101、获取目标对象针对多个应用的多个应用数据,所述多个应用与所述多个应用数据一一对应,所述多个应用数据中每一应用数据对应一个应用ID。
其中,多个应用可以是电子设备安装的多个应用,多个应用可包括以下至少一类应用:浏览器应用、支付应用、聊天应用、邮件应用、乘车应用、导航应用、阅读应用、视频播放应用、音乐播放应用、学习应用,例如英语学习应用,专业考试学习应用、购物应用、健身应用、快递应用、工作应用等等,在此不做限定。一般来说,用户的电子设备中,可能会同时安装同一类型的多个不同的应用,例如,电子设备中可能会同时安装微信和QQ两个聊天应用,又例如,电子设备中同时安装两个不同的视频应用等等。用户初次使用一个应用,一般会注册一个应用身份ID。
本申请实施例中,用户在使用应用时,会产生应用数据,因此,可获取目标对象针对多个应用的多个应用数据,每一应用数据对应该应用的应用ID。其中,应用数据可以包括以下至少一种:用户使用应用时注册的身份信息、用户使用应用的时间记录、位置记录、浏览记录、操作记录等等。例如,支付应用对应的应用数据可包括用户注册的身份信息、支付操作对应的支付时间、支付项目、支付金额、支付对象等等,在一些应用中,会将支付项目进行分类,例如,在超市购物的支付项目划分至生活支付类,从而,针对支付应用,可获取较为详细的应用数据。类似地,针对电子设备的其他应用,也可获取每一应用的应用数据,此处不再赘述。
102、根据所述多个应用数据形成应用ID之间的关系对,得到多个关系对,每一所述关系对为两个应用ID的关系对。
本申请实施例中,当用户使用电子设备上的多个不同应用,由于多个应用是同一用户进行使用,不同应用中的多个应用数据之间会具有一定关联性,因此,可根对多个应用的应用数据进行分析,确定多个应用中应用与应用之间的关系,并基于应用ID的维度,构建多个应用ID中,应用ID与应用ID之间的关系对。
可选地,上述步骤102中,根据多个应用数据形成应用ID之间的关系对,得到多个关系对,可包括以下步骤:
21、根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集,每一所述特征标签集对应一个应用的应用数据;
其中,针对每一应用的应用数据,可根据该应用数据确定多个维度的特征标签,得到该应用对应的特征标签集。例如,针对电子设备中聊天应用的应用数据,可确定以下多个维度的特征标签集:年龄:20岁、职业:学生、性别:男、爱好:游戏、游泳、健身、性格:话少、内敛...。又例如,针对电子设备中购物应用的应用数据,可确定以下多个维度的特征标签集:年龄:18-24岁、职业:学生、性别:男、其他:单身、运动、健身、游泳...。可以看出,针对电子设备中的多个应用,可根据多个应用数据中每一应用数据确定多个维度的特征标签,得到多个特征标签集。
请参阅图1C,图1C为本申请实施例提供的多个应用ID中每一应用ID对应的特征标签集的演示示意图,如图1C所示,针对每一应用,可以应用ID与特征标签之间的关系图的形式呈现每一应用对应的特征标签集。ID1、ID2、ID3可分别表示三个应用的应用ID,Y1、Y2、Y3、...可分别表示对应的特征标签集中的特征标签,进而,可将多个应用中每一应用对应的特征标签集与对应的应用ID关联起来。
可选地,上述步骤21中,所述多个维度对应预设的多个数据格式,根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集,可包括以下步骤:
A1、从所述多个应用数据中每一应用的应用数据中筛选出与所述多个数据格式中每一数据格式对应的特征数据,得到多组特征数据,所述多组特征数据每一组特征数据对应一个应用的应用数据;
A2、对所述多组特征数据中每一组特征数据对应进行特征提取,得到多个特征标签集。
其中,针对每一应用,可在获取该应用的应用数据后,筛选出预设的数据格式的特征数据,例如,应用数据中,时间、地点、爱好、年龄、性别一般会具有对应的数据格式,进而,可将具有对应的数据格式的特征数据进行筛选。具体地,针对特定应用,例如购物应用的应用数据可能包含用户的身份信息、多条购物记录,其中每一购物记录中包含购买商品、购物时间、金额、收货地址、收货人信息等数据、退换货记录等等,因此,可筛选出购买商品的商品信息中筛选经常购买的商品对应的特征数据,还可筛选出购物金额、购物时间对应的特征数据。然后,可针对每一应用的特征数据进行特征提取,得到该应用对应的特征标签集,从而,可针对多组特征数据进行特征集,得到多个应用对应的多个特征标签集,每一应用对应一个特征标签集。
22、根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对;其中,每一关系对中的两个应用ID具有相同特征标签。
其中,上述预设规则可以是将多个应用中的特征标签集进行匹配,得到匹配结果,然后根据匹配结果确定一个应用与另一应用对应的特征标签集中是否存在相同的特征标签。上述预设规则还可以是通过机器学习算法,确定多个特征标签集中具有相同特征标签的应用ID的关系对。具体地,可预先构建机器学习模型,该机器学习模型用于对多个应用中提取出来的特征标签进行训练,可将多个应用中,任意2个应用对应的两个特征标签集输入机器学习模型,通过该机器学习模型输出具有相同特征标签的应用ID的关系对的数据结果。从而,可确定多个应用中,存在相同特征标签的两个应用ID的关系对。
请参阅图1D,图1D为本申请实施例提供的一种根据预设规则将多个特征标签集中具有相同特征标签的应用ID形成关系对的演示示意图,其中,ID1对应的第一应用的第一特征标签集与ID2对应的第二应用的第二特征标签集中存在相同的特征标签;ID2对应的第二应用的第二特征标签集与ID3对应的第三应用的第三特征标签集中存在相同的特征标签。因此,可形成ID1与ID2之间的关系对,以及ID2与ID3之间的关系对,以此类推,可根据电子设备中的多个应用中所有存在相同特征标签的2个应用的2个应用ID形成关系对。
可选地,上述步骤22中,所述多个特征标签集中包括时序特征标签或者位置特征标签,所述根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对,可包括以下步骤:
B1、根据所述预设规则,将所述多个特征标签集中时序特征标签相同的应用ID形成时序关系对,得到多个时序关系对;或者,
B2、根据所述预设规则,将所述多个特征标签集中位置特征标签相同的应用ID形成位置关系对,得到多个位置关系对。
在一些可能的实施例中,应用中的特征标签包含时序特征标签或者位置特征标签,当用户在同一时间对多个应用进行操作,从多个应用的应用数据中可提取相同的时序特征标签。或者,用户操作不同的多个应用,对应的操作位置,属于同一位置,例如,用户在不同时间,在家中使用应用,则从多个应用中的应用数据中可提取湘潭的位置特征标签。
举例说明,请参阅图1E,图1E为本申请实施例提供的一种将所述多个特征标签集中时序特征标签相同的应用ID形成时序关系对的演示示意图,其中,ID1对应的第一应用的第一特征标签集与ID2对应的第二应用的第二特征标签集中存在相同的时序特征标签;ID1对应的第一应用的第一特征标签集与ID3对应的第三应用的第三特征标签集中存在相同的时序特征标签;ID1对应的第一应用的第一特征标签集与ID4对应的第四应用的第四特征标签集中存在相同的时序特征标签。T1Y1、T2Y2、T3Y3、...分别表示时序特征标签,因此,可形成ID1与ID2之间的关系对,ID1与ID3之间的关系对以及ID1与ID4之间的关系对,以此类推,可根据电子设备中的多个应用中所有存在相同时序特征标签的2个应用的2个应用ID形成关系对。
103、根据所述多个关系对构建用户画像。
本申请实施例中,多个关系对中每一关系对包含2个应用ID,每一对应用ID的特征标签集中的特征标签均为用户的特征标签,因此,可根据多个关系对中呈现的多个应用ID之间的联系,将多个应用ID对应的多个特征标签集中的多个特征标签与用户画像进行关联,具体地,可确定多个特征标签中每一特征标签与用户画像的关联度,特征标签与用户的关联度越大,表明该特征标签更加能表征用户的形象特点。
可选地,上述步骤103中,根据所述多个关系对构建用户画像,可包括以下步骤:
31、根据所述多个关系对中每一关系对中的2个应用ID对应的2个特征标签集确定所述每一关系对中2个应用ID之间的相似度,得到多个相似度,所述多个关系对与所述多个相似度一一对应;
其中,每一关系对中的2个应用ID之间的相似度,是指2个应用ID对应的2个特征标签集中的特征标签的相似度。2个应用ID对应的2个特征标签集中相同的特征标签越多,该2个应用ID之间的相似度越高。
可选地,上述步骤31中,根据所述多个关系对中每一关系对中的2个应用ID对应的2个特征标签集确定所述每一关系对中2个应用ID之间的相似度,得到多个相似度,可包括以下步骤:
C1、确定多个关系对中每一关系对中的2个应用ID对应的2个特征标签集中包含的相同特征标签的相同特征数量,得到多个相同特征数量,所述多个关系对与所述多个相同特征数量一一对应;
C2、确定所述多个相同特征数量中每一相同特征数量分别与对应的2个应用ID中每一应用ID的特征标签总数量的第一占比和第二占比,得到多个第一占比和多个第二占比,每一相同特征数量对应一个第一占比和一个第二占比;
C3、确定所述多个第一占比和多个第二占比中每一相同特征数量对应的所述第一占比和所述第二占比之和,得到多个占比和,所述多个占比和与所述多个关系对一一对应;
C4、根据预设的占比和与相似度之间的对应关系,得到所述多个占比和中每一占比和对应的相似度,得到多个相似度。
其中,可分别针对每一关系对中的2个应用ID确定该2个应用ID之间的相似度,具体地,可同时并行确定多个关系对中每一关系对之间的相似度,也可依次确定多个关系对中每一关系对之间的相似度。
本申请实施例中,针对每一关系对中的2个应用ID,可确定2个应用ID对应的2个特征标签集中包含的相同特征标签的相同特征数量,例如,2个特征标签集中包含的相同特征标签的相同特征数量可以是1个、2个、5个等等。然后,可确定相同特征数量与2个应用ID中每一应用ID的特征标签总数量的第一占比和第二占比,假定相同特征数量为2,2个应用ID中的特征标签总数量分别为3和4,则可确定第一占比为2/3,第二占比为2/4。从而,可确定第一占比和第二占比的占比和。进一步地,可根据预设的占比和与相似度之间的对应关系,得到该占比和对应的相似度。以此类推,针对多个关系对均可确定每一关系对对应的相似度,得到多个相似度。
32、根据所述多个相似度将多个所述多个关系对进行连接,得到特征关系图谱;
其中,可根据多个相似度中每一相似度确定对应关系对之间的参考距离,然后根据该参考距离将多个关系对进行连接,每一关系对中2个应用ID之间的相似度越高,距离越近,相似度越低,距离越远。
可选地,上述步骤32中,根据所述多个相似度将多个所述多个关系对进行连接,得到特征关系图谱,可包括以下步骤:
D1、根据预设的相似度与参考距离之间的对应关系,确定所述多个相似度中每一相似度对应的参考距离,得到多个参考距离,所述多个参考距离与所述多个关系对一一对应;
D2、根据所述多个参考距离中每一参考距离将所述多个关系对中每一参考距离对应的关系对进行连接,得到所述特征关系图谱。
其中,参考距离是指,将关系对中的2个应用ID进行连接时两个应用ID之间的连接距离。在特征关系图谱中,可根据相似度确定关系对中的2个应用ID之间的参考距离,从而,可通过特征关系图谱中的参考距离较为直观地呈现2个应用ID之间的相似度。
本申请实施例中,可预先设定相似度度与参考距离之间的对应关系,在确定多个关系对中每一关系对对应的相似度后,针对每一关系对中的2个应用ID,可根据预设的相似度与参考距离之间的对应关系,确定每一相似度对应的参考距离。
请参阅图1F,图1F为本申请实施例提供的一种将多个所述多个关系对进行连接的演示示意图,如图1F所示,根据多个相似度将多个所述多个关系对进行连接,得到特征关系图谱,可将多个关系对中每一关系对中的2个应用ID之间进行连接,具体地,第一应用ID可能与多个其他应用ID分别形成关系对,如此,第一应用ID可连接与其形成关系对的多个应用ID,与其连接的应用ID中,例如第二应用ID,可能与除第一应用ID以外的其他应用ID之间形成关系对,从而,第二应用ID可连接与其形成关系对的其他应用ID,其中,多个关系对中涉及应用ID均能连接至少一个应用ID,从而,多个关系对连接之后,可得到特征关系图谱。
33、根据所述特征关系图谱构建所述用户画像。
其中,特征关系图谱中包含多个应用ID对应的多个特征标签集中的多个特征标签。本申请实施例中,可根据特征关系图谱中来自多个应用的多个特征标签构建用户画像,从而,相比于根据单独的一个应用的应用数据构建用户画像,本方案构建的用户画像更加全面、准确。
可选地,上述步骤33中,根据所述特征关系图谱构建所述用户画像,可包括以下步骤:
E1、统计所述特征关系图谱包含的多个特征标签中每一特征标签的出现次数,得到多个出现次数;
其中,同一个特征标签可能出现在多个应用ID对应的多个特征标签集中,也就是说,多个特征标签集中包含相同的特征标签,因此,可统计特征关系图谱中每一相同的特征标签的出现次数,例如,若有5个应用ID对应的特征标签集中都包含特征标签“年龄:20岁”,则可确定特征标签“年龄:20岁”的出现次数为5次。从而,可统计出每一特征标签的出现次数,得到多个出现次数。
E2、根据所述多个出现次数中每一出现次数和对应特征标签所属至少一个关系对的至少一个参考距离确定对应特征标签与所述目标对象的关联度,得到多个关联度;
其中,针对每一特征标签,可根据该特征标签的出现次数以及该特征标签所属至少一个关系对的至少一个参考距离确定该特征标签对应的关联度,具体地,针对该特征标签,可确定该特征标签所属至少一个关系对的至少一个参考距离的参考距离和。例如,假定该特征标签分别出现在3个关系对包含的应用ID对应的特征标签集中,则可根据3个关系对对应的3个参考距离确定参考距离和。
可选地,上述步骤E2中,根据所述多个出现次数中每一出现次数和对应特征标签所属至少一个关系对的至少一个参考距离确定对应特征标签与所述目标对象的关联度,得到多个关联度,可包括以下步骤:
E21、确定所述多个特征标签中每一特征标签所属至少一个关系对的至少一个参考距离的参考距离和,得到多个参考距离和;
E22、根据预设的参考距离和与关联度参考值之间的对应关系确定所述多个参考距离和中每一参考距离和对应的第一关联度参考值,得到多个第一关联度参考值,所述多个第一关联度参考值与所述多个特征标签一一对应;
E23、根据预设的出现次数和关联度参考值之间的对应关系确定所述多个出现次数中每一出现次数对应的第二关联度参考值,得到多个第二关联度参考值,所述多个第一关联度参考值与所述第二关联度参考值一一对应;
E24、根据所述多个第一关联度参考值和所述多个第二关联度参考值中每一对应的第一关联度参考值和第二关联度参考值,以及预设的所述参考距离和对应的第一权值、所述出现次数对应的第二权值确定对应的特征标签的关联度,得到所述多个关联度,所述多个关联度与所述多个特征标签一一对应。
本申请实施例中,可预先设定参考距离和与关联度参考值之间的第一对应关系,以及出现次数和关联度参考值之间的第二对应关系,还可预先设定参考距离和对应的第一权值和出现次数对应的第二权值,然后根据第一对应关系确定该特征标签的参考距离和对应的第一关联度参考值,根据第二对应关系确定与该特征标签的出现次数对应的第二关联度参考值,进而,可根据如下公式确定该特征标签对应的关联度:关联度=第一关联度参考值*第一权值+第二关联度参考值*第二权值。
E3、根据预设的关联度与距离之间的对应关系,确定与所述多个关联度中每一关联度对应的目标距离,得到多个目标距离,所述多个目标距离与所述多个特征标签一一对应;
本申请实施例中,可预先设定关联度与距离之间的对应关系,从而,可确定多个关联度中每一关联度对应的目标距离,其中,关联度越大,对应的目标距离越小,关联度越小,对应的目标距离越大,通过确定多个关联度中每一关联度的目标距离,可通过目标距离较为直观地表征特征标签与用户之间的关联度。
E4、根据所述多个目标距离中每一目标距离将对应的特征标签与所述目标对象进行连接,得到所述目标对象的用户画像。
请参阅图1G,图1G为本申请实施例提供的一种构建用户画像的演示示意图,如图1G所示,根据所述多个目标距离中每一目标距离将对应的特征标签与目标对象进行连接,可将多个应用ID对应的多个特征标签均与用户进行关联,从而,可较为直观地展示用户画像,在构建的用户画像中,多个特征标签中每一特征标签与用户之间的关联度不同,可根据目标距离的大小直观地呈现用户的多个不同的特征标签,使得特征标签更加准确、完整以及生动。
可以看出,本申请实施例中所描述的用户画像构建方法,通过获取目标对象针对多个应用的多个应用数据,根据多个应用数据形成应用ID之间的关系对,得到多个关系对,根据多个关系对构建用户画像,如此,可基于多个应用的应用ID维度构建多个应用之间的关系,然后基于多个应用之间的关系构建更加完整的用户画像,使用户画像更加完整、准确,使得用户画像的构建更加智能。
与上述一致地,请参阅图2,图2是本申请实施例提供的另一种用户画像构建方法的流程示意图,本实施例中所描述的用户画像构建方法,应用于电子设备,该方法可包括以下步骤:
201、获取目标对象针对多个应用的多个应用数据,所述多个应用与所述多个应用数据一一对应,所述多个应用数据中每一应用数据对应一个应用ID。
202、根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集,每一所述特征标签集对应一个应用的应用数据。
203、根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对;其中,每一所述关系对为两个应用ID的关系对,每一关系对中的两个应用ID具有相同特征标签。
204、根据所述多个关系对中每一关系对中的2个应用ID对应的2个特征标签集确定所述每一关系对中2个应用ID之间的相似度,得到多个相似度,所述多个关系对与所述多个相似度一一对应。
205、根据所述多个相似度将所述多个关系对进行连接,得到特征关系图谱。
206、根据所述特征关系图谱构建所述用户画像。
其中,上述步骤201-206的具体实现过程可参照图1B所示的方法中相应的描述,在此不再赘述。
可以看出,本申请实施例中所描述的用户画像构建方法,通过获取目标对象针对多个应用的多个应用数据,根据多个应用数据中每一应用数据确定多个维度的特征标签,得到多个特征标签集,根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对,根据多个关系对中每一关系对中的2个应用ID对应的2个特征标签集确定所述2个应用ID之间的相似度,得到多个相似度,根据多个相似度将多个关系对进行连接,得到特征关系图谱,根据特征关系图谱构建用户画像,如此,可基于应用ID维度构建多个应用的特征关系图谱,然后根据特征关系图谱中特征标签之间的关系构建用户画像,使用户画像更加完整、准确,使得用户画像的构建更加智能。
与上述一致地,请参阅图3,为本申请实施例提供的另一种用户画像构建方法的实施例流程示意图,本实施例中所描述的用户画像构建方法,应用于如图1A的电子设备,本方法可包括以下步骤:
301、获取目标对象针对多个应用的多个应用数据,所述多个应用与所述多个应用数据一一对应,所述多个应用数据中每一应用数据对应一个应用ID。
302、根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集,每一所述特征标签集对应一个应用的应用数据。
303、根据所述预设规则,将所述多个特征标签集中时序特征标签相同的应用ID形成时序关系对,得到多个时序关系对。
304、根据所述多个时序关系对中每一时序关系对的2个应用ID对应的2个特征标签集确定所述每一时序关系对中2个应用ID之间的相似度,得到多个相似度,所述多个时序关系对与所述多个相似度一一对应。
305、根据所述多个相似度将多个所述多个时序关系对进行连接,得到特征关系图谱。
306、根据所述特征关系图谱构建所述用户画像。
其中,上述步骤301-306的具体实现过程可参照图1B所示的方法中相应的描述,在此不再赘述。
本申请实施例中所描述的用户画像构建方法,通过获取目标对象针对多个应用的多个应用数据,根据多个应用数据中每一应用数据确定多个维度的特征标签,得到多个特征标签集,根据预设规则,将多个特征标签集中时序特征标签相同的应用ID形成时序关系对,得到多个时序关系对,根据多个时序关系对中每一时序关系对中的2个应用ID对应的2个特征标签集确定所述2个应用ID之间的相似度,得到多个相似度,根据多个相似度将多个时序关系对进行连接,得到特征关系图谱,根据特征关系图谱构建用户画像,如此,可基于应用ID维度构建多个应用的特征关系图谱,然后根据特征关系图谱中时序特征标签之间的关系构建用户画像,使用户画像更加完整、准确,使得用户画像的构建更加智能。
与上述一致地,请参阅图4,图4是本申请实施例提供的一种电子设备400,包括:处理器410、存储器420、通信接口430以及一个或多个程序421,所述一个或多个程序421被存储在所述存储器420中,并且被配置成由所述处理器410执行,所述程序包括用于执行以下步骤的指令:
获取目标对象针对多个应用的多个应用数据,所述多个应用与所述多个应用数据一一对应,所述多个应用数据中每一应用数据对应一个应用ID;
根据所述多个应用数据形成应用ID之间的关系对,得到多个关系对,每一所述关系对为两个应用ID的关系对;
根据所述多个关系对构建用户画像。
在一个可能的示例中,在所述根据多个应用数据形成应用ID之间的关系对,得到多个关系对方面,所述程序421包括用于执行以下步骤的指令:
根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集,每一所述特征标签集对应一个应用的应用数据;
根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对;其中,每一关系对中的两个应用ID具有相同特征标签。
在一个可能的示例中,所述多个维度对应预设的多个数据格式,在所述根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集方面,所述程序421包括用于执行以下步骤的指令:
从所述多个应用数据中每一应用的应用数据中筛选出与所述多个数据格式中每一数据格式对应的特征数据,得到多组特征数据,所述多组特征数据每一组特征数据对应一个应用的应用数据;
对所述多组特征数据中每一组特征数据对应进行特征提取,得到多个特征标签集。
在一个可能的示例中,所述多个特征标签集中包括时序特征标签或者位置特征标签,在所述根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对方面,所述程序421包括用于执行以下步骤的指令:
根据所述预设规则,将所述多个特征标签集中时序特征标签相同的应用ID形成时序关系对,得到多个时序关系对;或者,根据所述预设规则,将所述多个特征标签集中位置特征标签相同的应用ID形成位置关系对,得到多个位置关系对。
在一个可能的示例中,在所述根据所述多个关系对构建用户画像方面,所述程序421包括用于执行以下步骤的指令:
根据所述多个关系对中每一关系对中的2个应用ID对应的2个特征标签集确定所述每一关系对中2个应用ID之间的相似度,得到多个相似度,所述多个关系对与所述多个相似度一一对应;
根据所述多个相似度将所述多个关系对进行连接,得到特征关系图谱;
根据所述特征关系图谱构建所述用户画像。
在一个可能的示例中,在所述根据所述多个关系对中每一关系对中的2个应用ID对应的2个特征标签集确定所述每一关系对中2个应用ID之间的相似度,得到多个相似度方面,所述程序421包括用于执行以下步骤的指令:
确定多个关系对中每一关系对中的2个应用ID对应的2个特征标签集中包含的相同特征标签的相同特征数量,得到多个相同特征数量,所述多个关系对与所述多个相同特征数量一一对应;
确定所述多个相同特征数量中每一相同特征数量分别与对应的2个应用ID中每一应用ID的特征标签总数量的第一占比和第二占比,得到多个第一占比和多个第二占比,每一相同特征数量对应一个第一占比和一个第二占比;
确定所述多个第一占比和多个第二占比中每一相同特征数量对应的所述第一占比和所述第二占比之和,得到多个占比和,所述多个占比和与所述多个关系对一一对应;
根据预设的占比和与相似度之间的对应关系,得到所述多个占比和中每一占比和对应的相似度,得到多个相似度。
在一个可能的示例中,在所述根据所述多个相似度将多个所述多个关系对进行连接,得到特征关系图谱方面,所述程序421包括用于执行以下步骤的指令:
根据预设的相似度与参考距离之间的对应关系,确定所述多个相似度中每一相似度对应的参考距离,得到多个参考距离,所述多个参考距离与所述多个关系对一一对应;
根据所述多个参考距离中每一参考距离将所述多个关系对中每一参考距离对应的关系对进行连接,得到所述特征关系图谱。
在一个可能的示例中,在所述根据所述特征关系图谱构建所述用户画像方面,所述程序包括用于执行以下步骤的指令:
统计所述特征关系图谱包含的多个特征标签中每一特征标签的出现次数,得到多个出现次数;
根据所述多个出现次数中每一出现次数和对应特征标签所属至少一个关系对的至少一个参考距离确定对应特征标签与所述目标对象的关联度,得到多个关联度;
根据预设的关联度与距离之间的对应关系,确定与所述多个关联度中每一关联度对应的目标距离,得到多个目标距离,所述多个目标距离与所述多个特征标签一一对应;
根据所述多个目标距离中每一目标距离将对应的特征标签与所述目标对象进行连接,得到所述目标对象的用户画像。
在一个可能的示例中,在所述根据所述多个出现次数中每一出现次数和对应特征标签所属至少一个关系对的至少一个参考距离确定对应特征标签与所述目标对象的关联度,得到多个关联度方面,所述程序421还包括用于执行以下步骤的指令:
确定所述多个特征标签中每一特征标签所属至少一个关系对的至少一个参考距离的参考距离和,得到多个参考距离和;
根据预设的参考距离和与关联度参考值之间的对应关系确定所述多个参考距离和中每一参考距离和对应的第一关联度参考值,得到多个第一关联度参考值,所述多个第一关联度参考值与所述多个特征标签一一对应;
根据预设的出现次数和关联度参考值之间的对应关系确定所述多个出现次数中每一出现次数对应的第二关联度参考值,得到多个第二关联度参考值,所述多个第一关联度参考值与所述第二关联度参考值一一对应;
根据所述多个第一关联度参考值和所述多个第二关联度参考值中每一对应的第一关联度参考值和第二关联度参考值,以及预设的所述参考距离和对应的第一权值、所述出现次数对应的第二权值确定对应的特征标签的关联度,得到所述多个关联度,所述多个关联度与所述多个特征标签一一对应。
请参阅图5,图5是本实施例提供的一种用户画像构建装置的结构示意图。该用户画像构建装置应用于如图1A所示的电子设备,所述用户画像构建装置包括获取单元501、处理单元502和构建单元503,其中,
所述获取单元501,用于获取目标对象针对多个应用的多个应用数据,所述多个应用与所述多个应用数据一一对应,所述多个应用数据中每一应用数据对应一个应用ID;
所述处理单元502,用于根据所述多个应用数据形成应用ID之间的关系对,得到多个关系对,每一所述关系对为两个应用ID的关系对;
所述构建单元503,用于根据所述多个关系对构建用户画像。
可选地,在所述根据多个应用数据形成应用ID之间的关系对,得到多个关系对方面,所述处理单元502具体用于:
根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集,每一所述特征标签集对应一个应用的应用数据;
根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对;其中,每一关系对中的两个应用ID具有相同特征标签。
可选地,所述多个维度对应预设的多个数据格式,在所述根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集方面,所述处理单元502具体用于:
从所述多个应用数据中每一应用的应用数据中筛选出与所述多个数据格式中每一数据格式对应的特征数据,得到多组特征数据,所述多组特征数据每一组特征数据对应一个应用的应用数据;
对所述多组特征数据中每一组特征数据对应进行特征提取,得到多个特征标签集。
可选地,所述多个特征标签集中包括时序特征标签或者位置特征标签,在所述根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对方面,所述处理单元502具体用于:
根据所述预设规则,将所述多个特征标签集中时序特征标签相同的应用ID形成时序关系对,得到多个时序关系对;或者,
根据所述预设规则,将所述多个特征标签集中位置特征标签相同的应用ID形成位置关系对,得到多个位置关系对。
可选地,在所述根据所述多个关系对构建用户画像方面,所述构建单元503具体用于:
根据所述多个关系对中每一关系对中的2个应用ID对应的2个特征标签集确定所述每一关系对中2个应用ID之间的相似度,得到多个相似度,所述多个关系对与所述多个相似度一一对应;
根据所述多个相似度将多个所述多个关系对进行连接,得到特征关系图谱;
根据所述特征关系图谱构建所述用户画像。
可选地,在所述根据所述多个关系对中每一关系对中的2个应用ID对应的2个特征标签集确定所述每一关系对中2个应用ID之间的相似度,得到多个相似度方面,所述构建单元503具体用于:
确定多个关系对中每一关系对中的2个应用ID对应的2个特征标签集中包含的相同特征标签的相同特征数量,得到多个相同特征数量,所述多个关系对与所述多个相同特征数量一一对应;
确定所述多个相同特征数量中每一相同特征数量分别与对应的2个应用ID中每一应用ID的特征标签总数量的第一占比和第二占比,得到多个第一占比和多个第二占比,每一相同特征数量对应一个第一占比和一个第二占比;
确定所述多个第一占比和多个第二占比中每一相同特征数量对应的所述第一占比和所述第二占比之和,得到多个占比和,所述多个占比和与所述多个关系对一一对应;
根据预设的占比和与相似度之间的对应关系,得到所述多个占比和中每一占比和对应的相似度,得到多个相似度。
可选地,在所述根据所述多个相似度将多个所述多个关系对进行连接,得到特征关系图谱方面,所述构建单元503具体用于:
根据预设的相似度与参考距离之间的对应关系,确定所述多个相似度中每一相似度对应的参考距离,得到多个参考距离,所述多个参考距离与所述多个关系对一一对应;
根据所述多个参考距离中每一参考距离将所述多个关系对中每一参考距离对应的关系对进行连接,得到所述特征关系图谱。
可选地,在所述根据所述特征关系图谱构建所述用户画像方面,所述构建单元503具体用于:
统计所述特征关系图谱包含的多个特征标签中每一特征标签的出现次数,得到多个出现次数;
根据所述多个出现次数中每一出现次数和对应特征标签所属至少一个关系对的至少一个参考距离确定对应类型特征标签与所述目标对象的关联度,得到多个关联度;
根据预设的关联度与距离之间的对应关系,确定与所述多个关联度中每一关联度对应的目标距离,得到多个目标距离,所述多个目标距离与所述多个特征标签一一对应;
根据所述多个目标距离中每一目标距离将对应的特征标签与所述目标对象进行连接,得到所述目标对象的用户画像。
可选地,在所述根据所述多个出现次数中每一出现次数和对应特征标签所属至少一个关系对的至少一个参考距离确定对应特征标签与所述目标对象的关联度,得到多个关联度方面,所述构建单元503具体用于:
确定所述多个特征标签中每一特征标签所属至少一个关系对的至少一个参考距离的参考距离和,得到多个参考距离和;
根据预设的参考距离和与关联度参考值之间的对应关系确定所述多个参考距离和中每一参考距离和对应的第一关联度参考值,得到多个第一关联度参考值,所述多个第一关联度参考值与所述多个特征标签一一对应;
根据预设的出现次数和关联度参考值之间的对应关系确定所述多个出现次数中每一出现次数对应的第二关联度参考值,得到多个第二关联度参考值,所述多个第一关联度参考值与所述第二关联度参考值一一对应;
根据所述多个第一关联度参考值和所述多个第二关联度参考值中每一对应的第一关联度参考值和第二关联度参考值,以及预设的所述参考距离和对应的第一权值、所述出现次数对应的第二权值确定对应的特征标签的关联度,得到所述多个关联度,所述多个关联度与所述多个特征标签一一对应。
可以看出,本申请实施例中所描述的用户画像构建装置,通过获取目标对象针对多个应用的多个应用数据,根据多个应用数据形成应用ID之间的关系对,得到多个关系对,根据多个关系对构建用户画像,如此,可基于多个应用的应用ID维度构建多个应用之间的关系,然后基于多个应用之间的关系构建更加完整的用户画像,使用户画像更加完整、准确,使得用户画像的构建更加智能。
可以理解的是,本实施例的用户画像构建装置的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种用户画像构建方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种用户画像构建方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (15)
1.一种用户画像构建方法,其特征在于,所述方法包括:
获取目标对象针对多个应用的多个应用数据,所述多个应用与所述多个应用数据一一对应,所述多个应用数据中每一应用数据对应一个应用ID;
根据所述多个应用数据形成应用ID之间的关系对,得到多个关系对,每一所述关系对为两个应用ID的关系对;
确定所述多个关系对中每一关系对中的2个应用ID对应的2个特征标签集中包含的相同特征标签的相同特征数量,得到多个相同特征数量,所述多个关系对与所述多个相同特征数量一一对应;
确定所述多个相同特征数量中每一相同特征数量分别与对应的2个应用ID中每一应用ID的特征标签总数量的第一占比和第二占比,得到多个第一占比和多个第二占比,每一相同特征数量对应一个第一占比和一个第二占比;
确定所述多个第一占比和所述多个第二占比中每一相同特征数量对应的所述第一占比和所述第二占比之和,得到多个占比和,所述多个占比和与所述多个关系对一一对应;
根据预设的占比和与相似度之间的对应关系,得到所述多个占比和中每一占比和对应的相似度,得到多个相似度,所述多个关系对与所述多个相似度一一对应;
根据所述多个相似度将所述多个关系对进行连接,得到特征关系图谱;
根据所述特征关系图谱构建用户画像。
2.根据权利要求1所述的方法,其特征在于,所述根据多个应用数据形成应用ID之间的关系对,得到多个关系对,包括:
根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集,每一所述特征标签集对应一个应用的应用数据;
根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对;其中,每一关系对中的两个应用ID具有相同特征标签。
3.根据权利要求2所述的方法,其特征在于,所述多个维度对应预设的多个数据格式,所述根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集,包括:
从所述多个应用数据中每一应用的应用数据中筛选出与所述多个数据格式中每一数据格式对应的特征数据,得到多组特征数据,所述多组特征数据中每一组特征数据对应一个应用的应用数据;
对所述多组特征数据中每一组特征数据进行特征提取,得到多个特征标签集。
4.根据权利要求2或3所述的方法,其特征在于,所述多个特征标签集中包括时序特征标签或者位置特征标签,所述根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对,包括:
根据所述预设规则,将所述多个特征标签集中时序特征标签相同的应用ID形成时序关系对,得到多个时序关系对;或者,
根据所述预设规则,将所述多个特征标签集中位置特征标签相同的应用ID形成位置关系对,得到多个位置关系对。
5.根据权利要求1所述的方法,其特征在于,所述根据所述多个相似度将多个所述多个关系对进行连接,得到特征关系图谱,包括:
根据预设的相似度与参考距离之间的对应关系,确定所述多个相似度中每一相似度对应的参考距离,得到多个参考距离,所述多个参考距离与所述多个关系对一一对应;
根据所述多个参考距离中每一参考距离将所述多个关系对中每一参考距离对应的关系对进行连接,得到所述特征关系图谱。
6.根据权利要求5所述的方法,其特征在于,所述根据所述特征关系图谱构建所述用户画像,包括:
统计所述特征关系图谱包含的多个特征标签中每一特征标签的出现次数,得到多个出现次数;
根据所述多个出现次数中每一出现次数和对应特征标签所属至少一个关系对的至少一个参考距离确定对应特征标签与所述目标对象的关联度,得到多个关联度;
根据预设的关联度与距离之间的对应关系,确定与所述多个关联度中每一关联度对应的目标距离,得到多个目标距离,所述多个目标距离与所述多个特征标签一一对应;
根据所述多个目标距离中每一目标距离将对应的特征标签与所述目标对象进行连接,得到所述目标对象的用户画像。
7.根据权利要求6所述的方法,其特征在于,所述根据所述多个出现次数中每一出现次数和对应特征标签所属至少一个关系对的至少一个参考距离确定对应特征标签与所述目标对象的关联度,得到多个关联度,包括:
确定所述多个特征标签中每一特征标签所属至少一个关系对的至少一个参考距离的参考距离和,得到多个参考距离和;
根据预设的参考距离和与关联度参考值之间的对应关系确定所述多个参考距离和中每一参考距离和对应的第一关联度参考值,得到多个第一关联度参考值,所述多个第一关联度参考值与所述多个特征标签一一对应;
根据预设的出现次数和关联度参考值之间的对应关系确定所述多个出现次数中每一出现次数对应的第二关联度参考值,得到多个第二关联度参考值,所述多个第一关联度参考值与所述第二关联度参考值一一对应;
根据所述多个第一关联度参考值和所述多个第二关联度参考值中每一对应的第一关联度参考值和第二关联度参考值,以及预设的所述参考距离和对应的第一权值、所述出现次数对应的第二权值确定对应的特征标签的关联度,得到所述多个关联度,所述多个关联度与所述多个特征标签一一对应。
8.一种用户画像构建装置,其特征在于,所述用户画像构建装置包括:
获取单元,用于获取目标对象针对多个应用的多个应用数据,所述多个应用与所述多个应用数据一一对应,所述多个应用数据中每一应用数据对应一个应用ID;
处理单元,用于根据所述多个应用数据形成应用ID之间的关系对,得到多个关系对,每一所述关系对为两个应用ID的关系对;
构建单元,用于确定所述多个关系对中每一关系对中的2个应用ID对应的2个特征标签集中包含的相同特征标签的相同特征数量,得到多个相同特征数量,所述多个关系对与所述多个相同特征数量一一对应;
所述构建单元,还用于确定所述多个相同特征数量中每一相同特征数量分别与对应的2个应用ID中每一应用ID的特征标签总数量的第一占比和第二占比,得到多个第一占比和多个第二占比,每一相同特征数量对应一个第一占比和一个第二占比;
所述构建单元,还用于确定所述多个第一占比和所述多个第二占比中每一相同特征数量对应的所述第一占比和所述第二占比之和,得到多个占比和,所述多个占比和与所述多个关系对一一对应;
所述构建单元,还用于根据预设的占比和与相似度之间的对应关系,得到所述多个占比和中每一占比和对应的相似度,得到多个相似度,所述多个关系对与所述多个相似度一一对应;
所述构建单元,还用于根据所述多个相似度将所述多个关系对进行连接,得到特征关系图谱;
所述构建单元,还用于根据所述特征关系图谱构建用户画像。
9.根据权利要求8所述的装置,其特征在于,在所述根据多个应用数据形成应用ID之间的关系对,得到多个关系对方面,所述处理单元用于:
根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集,每一所述特征标签集对应一个应用的应用数据;
根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对;其中,每一关系对中的两个应用ID具有相同特征标签。
10.根据权利要求9所述的装置,其特征在于,所述多个维度对应预设的多个数据格式,在所述根据所述多个应用数据中每一应用的应用数据确定多个维度的特征标签,得到多个特征标签集方面,所述处理单元用于:
从所述多个应用数据中每一应用的应用数据中筛选出与所述多个数据格式中每一数据格式对应的特征数据,得到多组特征数据,所述多组特征数据每一组特征数据对应一个应用的应用数据;
对所述多组特征数据中每一组特征数据对应进行特征提取,得到多个特征标签集。
11.根据权利要求9或10所述的装置,其特征在于,所述多个特征标签集中包括时序特征标签或者位置特征标签,在所述根据预设规则将所述多个特征标签集中具有相同特征标签的应用ID形成关系对,得到多个关系对方面,所述处理单元用于:
根据所述预设规则,将所述多个特征标签集中时序特征标签相同的应用ID形成时序关系对,得到多个时序关系对;或者,
根据所述预设规则,将所述多个特征标签集中位置特征标签相同的应用ID形成位置关系对,得到多个位置关系对。
12.根据权利要求8所述的装置,其特征在于,在所述根据所述多个相似度将多个所述多个关系对进行连接,得到特征关系图谱方面,所述构建单元用于:
根据预设的相似度与参考距离之间的对应关系,确定所述多个相似度中每一相似度对应的参考距离,得到多个参考距离,所述多个参考距离与所述多个关系对一一对应;
根据所述多个参考距离中每一参考距离将所述多个关系对中每一参考距离对应的关系对进行连接,得到所述特征关系图谱。
13.根据权利要求12所述的装置,其特征在于,在所述根据所述特征关系图谱构建所述用户画像方面,所述构建单元用于:
统计所述特征关系图谱包含的多个特征标签中每一特征标签的出现次数,得到多个出现次数;
根据所述多个出现次数中每一出现次数和对应特征标签所属至少一个关系对的至少一个参考距离确定对应类型特征标签与所述目标对象的关联度,得到多个关联度;
根据预设的关联度与距离之间的对应关系,确定与所述多个关联度中每一关联度对应的目标距离,得到多个目标距离,所述多个目标距离与所述多个特征标签一一对应;
根据所述多个目标距离中每一目标距离将对应的特征标签与所述目标对象进行连接,得到所述目标对象的用户画像。
14.一种电子设备,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。
15.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-7任一项所述的方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/090753 WO2020248131A1 (zh) | 2019-06-11 | 2019-06-11 | 用户画像构建方法及相关产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113396433A CN113396433A (zh) | 2021-09-14 |
CN113396433B true CN113396433B (zh) | 2023-12-26 |
Family
ID=73780687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980091306.3A Active CN113396433B (zh) | 2019-06-11 | 2019-06-11 | 用户画像构建方法及相关产品 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113396433B (zh) |
WO (1) | WO2020248131A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113077142B (zh) * | 2021-03-31 | 2022-12-27 | 国家电网有限公司 | 智能学员画像方法、系统及终端设备 |
CN113064904B (zh) * | 2021-04-29 | 2022-04-08 | 济南慧天云海信息技术有限公司 | 一种基于数据自学习的画像构建方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933049A (zh) * | 2014-03-17 | 2015-09-23 | 华为技术有限公司 | 生成数字人的方法及系统 |
CN105677844A (zh) * | 2016-01-06 | 2016-06-15 | 北京摩比万思科技有限公司 | 一种移动广告大数据的定向推送及用户跨屏识别方法 |
CN106940705A (zh) * | 2016-12-20 | 2017-07-11 | 上海掌门科技有限公司 | 一种用于构建用户画像的方法与设备 |
CN108154395A (zh) * | 2017-12-26 | 2018-06-12 | 上海新炬网络技术有限公司 | 一种基于大数据的客户网络行为画像方法 |
WO2018157818A1 (zh) * | 2017-03-02 | 2018-09-07 | 广州市动景计算机科技有限公司 | 用户偏好的推测方法、装置、终端设备及存储介质 |
CN109598525A (zh) * | 2017-09-30 | 2019-04-09 | 北京国双科技有限公司 | 数据处理方法和装置 |
CN109670112A (zh) * | 2018-12-20 | 2019-04-23 | 北京城市网邻信息技术有限公司 | 一种用户画像id的生成方法、装置、存储介质及终端 |
CN109684330A (zh) * | 2018-12-17 | 2019-04-26 | 深圳市华云中盛科技有限公司 | 用户画像库构建方法、装置、计算机设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130159103A1 (en) * | 2011-12-16 | 2013-06-20 | AppLovin Corporation | Advertisement Selection Based on Mobile Applications |
US20180232643A1 (en) * | 2017-02-10 | 2018-08-16 | International Business Machines Corporation | Identifying user engagement based upon emotional state |
CN106874449A (zh) * | 2017-02-10 | 2017-06-20 | 维沃移动通信有限公司 | 一种应用程序的搜索方法及移动终端 |
-
2019
- 2019-06-11 WO PCT/CN2019/090753 patent/WO2020248131A1/zh active Application Filing
- 2019-06-11 CN CN201980091306.3A patent/CN113396433B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933049A (zh) * | 2014-03-17 | 2015-09-23 | 华为技术有限公司 | 生成数字人的方法及系统 |
CN105677844A (zh) * | 2016-01-06 | 2016-06-15 | 北京摩比万思科技有限公司 | 一种移动广告大数据的定向推送及用户跨屏识别方法 |
CN106940705A (zh) * | 2016-12-20 | 2017-07-11 | 上海掌门科技有限公司 | 一种用于构建用户画像的方法与设备 |
WO2018157818A1 (zh) * | 2017-03-02 | 2018-09-07 | 广州市动景计算机科技有限公司 | 用户偏好的推测方法、装置、终端设备及存储介质 |
CN109598525A (zh) * | 2017-09-30 | 2019-04-09 | 北京国双科技有限公司 | 数据处理方法和装置 |
CN108154395A (zh) * | 2017-12-26 | 2018-06-12 | 上海新炬网络技术有限公司 | 一种基于大数据的客户网络行为画像方法 |
CN109684330A (zh) * | 2018-12-17 | 2019-04-26 | 深圳市华云中盛科技有限公司 | 用户画像库构建方法、装置、计算机设备及存储介质 |
CN109670112A (zh) * | 2018-12-20 | 2019-04-23 | 北京城市网邻信息技术有限公司 | 一种用户画像id的生成方法、装置、存储介质及终端 |
Non-Patent Citations (1)
Title |
---|
一种用户画像系统的设计与实现;王洋 等;计算机应用与软件;第35卷(第03期);8-14 * |
Also Published As
Publication number | Publication date |
---|---|
WO2020248131A1 (zh) | 2020-12-17 |
CN113396433A (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021003673A1 (zh) | 内容推送方法及相关产品 | |
WO2020257988A1 (zh) | 刷量用户识别方法及相关产品 | |
CN102687100B (zh) | 用于提供力敏感输入的用户接口方法和系统 | |
CN109302338A (zh) | 智能风险提示方法、移动终端及计算机可读存储介质 | |
CN111050370A (zh) | 网络切换方法、装置、存储介质及电子设备 | |
CN110428311B (zh) | 招投标信息推荐方法及相关产品 | |
CN107870790A (zh) | 基于游戏应用的推送消息处理方法以及相关产品 | |
CN111339737B (zh) | 实体链接方法、装置、设备及存储介质 | |
CN113396433B (zh) | 用户画像构建方法及相关产品 | |
CN112329926B (zh) | 智能机器人的质量改善方法及系统 | |
CN108833779A (zh) | 拍摄控制方法及相关产品 | |
CN110672262B (zh) | 压力按键阈值校准方法、装置、存储介质及电子设备 | |
CN113940033B (zh) | 用户识别方法及相关产品 | |
CN105373580A (zh) | 主题显示方法及装置 | |
CN110929159B (zh) | 资源投放方法、装置、设备及介质 | |
CN108664205A (zh) | 信息显示方法、装置、移动终端以及存储介质 | |
WO2020147007A1 (zh) | 信息推送方法及相关产品 | |
CN110298277A (zh) | 指纹识别方法及相关产品 | |
CN109144721A (zh) | 资源排序方法、资源显示方法、相关装置及存储介质 | |
CN113950817B (zh) | 内容推送方法及相关产品 | |
WO2020252742A1 (zh) | 资源推送方法及相关产品 | |
CN109359453B (zh) | 解锁方法及相关产品 | |
CN116307394A (zh) | 产品用户体验评分方法、装置、介质及设备 | |
CN107436896A (zh) | 一种输入推荐方法、装置及电子设备 | |
CN109547329A (zh) | 群组信息的显示方法及相关产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |