CN113592590A - 一种用户画像生成方法及装置 - Google Patents

一种用户画像生成方法及装置 Download PDF

Info

Publication number
CN113592590A
CN113592590A CN202110852383.5A CN202110852383A CN113592590A CN 113592590 A CN113592590 A CN 113592590A CN 202110852383 A CN202110852383 A CN 202110852383A CN 113592590 A CN113592590 A CN 113592590A
Authority
CN
China
Prior art keywords
training
behavior information
user
label
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110852383.5A
Other languages
English (en)
Inventor
成晨
程新洲
宋春涛
张帆
周诗雨
朱小萌
王昭宁
曹丽娟
高洁
王云云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202110852383.5A priority Critical patent/CN113592590A/zh
Publication of CN113592590A publication Critical patent/CN113592590A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种用户画像生成方法及装置,涉及计算机技术领域,解决了在获取用户画像的过程中,如何准确的确定用户各个行为的权重的技术问题。该方法包括:获取终端在第一预设时间段内的一个行为信息的标签特征;一个行为信息为社交行为信息、购物行为信息或者应用程序使用行为信息中的任意一个;将一个行为信息的标签特征输入到预先训练好的目标模型,以确定标签特征的权重值;根据权重值,生成终端的用户画像。

Description

一种用户画像生成方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户画像生成方法及装置。
背景技术
随着互联网技术的迅猛发展,适用于用户线上活动的各类平台应运而生。平台为了向用户提供精准推荐服务,通常以构建用户画像的方式,来了解用户的行为习惯、消费习惯等信息,以改进服务质量,提升用户体验。
目前,用户画像可以基于历史的互联网大数据,通过一定的算法获取。如“经常团购”“母婴偏好”“有车用户”“未来一个月会下单”“未来一个月会换手机”“未来一个月会携号转网”等。
在获取用户画像的过程中,通常会人为设置各个行为(如浏览、搜索、收藏、下单、购买等)的初始权重,然后基于发生这些行为的次数、行为类型的初始权重、时间衰减来计算用户的标签权重,以得到用户画像。但是,由于初始权重是由运营人员或数据分析人员主观给出的,所以,这种确定初始权重的方法主观因素较多,可能无法准确衡量用户的行为模式,进而降低了确定用户画像的准确度。
发明内容
本申请实施例提供一种用户画像生成方法及装置,解决了在获取用户画像的过程中,如何准确的确定用户各个行为的权重的技术问题。
为达到上述目的,本申请实施例采用如下技术方案:
第一方面,提供一种用户画像生成方法,包括:获取终端在第一预设时间段内的一个行为信息的标签特征;一个行为信息为社交行为信息、购物行为信息或者应用程序使用行为信息中的任意一个;将一个行为信息的标签特征输入到预先训练好的目标模型,以确定标签特征的权重值;根据权重值,生成终端的用户画像。
用户画像生成装置通过预先训练好的目标模型,对终端在第一预设时间段内的一个行为信息的标签特征进行训练,以确定终端的用户的标签特征的权重值,并根据权重值,生成终端的用户画像。相比现有技术,本申请实施例提供的方案解决了在获取用户画像的过程中,如何准确的确定用户各个行为的权重的技术问题,提高了确定用户画像的准确度。
第二方面,提供一种用户画像生成装置,该用户画像生成装置包括:获取单元,处理单元和生成单元;获取单元,用于获取终端在第一预设时间段内的一个行为信息的标签特征;一个行为信息为社交行为信息、购物行为信息或者应用程序使用行为信息中的任意一个;处理单元,用于将一个行为信息的标签特征输入到预先训练好的目标模型,以确定标签特征的权重值;生成单元,用于根据权重值,生成终端的用户画像。
第三方面,提供一种用户画像生成装置,包括存储器和处理器。存储器用于存储计算机执行指令,处理器与存储器通过总线连接。当用户画像生成装置运行时,处理器执行存储器存储的计算机执行指令,以使用户画像生成装置执行第一方面所述的用户画像生成方法。
该用户画像生成装置可以是网络设备,也可以是网络设备中的一部分装置,例如网络设备中的芯片系统。该芯片系统用于支持网络设备实现第一方面及其任意一种可能的实现方式中所涉及的功能,例如,接收、确定、分流上述用户画像生成方法中所涉及的数据和/或信息。该芯片系统包括芯片,也可以包括其他分立器件或电路结构。
第四方面,提供一种计算机可读存储介质,计算机可读存储介质包括计算机执行指令,当计算机执行指令在计算机上运行时,使得该计算机执行第一方面所述的用户画像生成方法。
第五方面,提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如第一方面及其任一种可能的设计方式所述的用户画像生成方法。
需要说明的是,上述计算机指令可以全部或者部分存储在第一计算机存储介质上。其中,第一计算机存储介质可以与用户画像生成装置的处理器封装在一起的,也可以与用户画像生成装置的处理器单独封装,本申请实施例对此不作限定。
本发明中第二方面、第三方面、第四方面以及第五方面的描述,可以参考第一方面的详细描述;并且,第二方面、第三方面、第四方面以及第五方面的有益效果,可以参考第一方面的有益效果分析,此处不再赘述。
在本申请实施例中,上述用户画像生成装置的名字对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本发明类似,属于本发明权利要求及其等同技术的范围之内。
本发明的这些方面或其他方面在以下的描述中会更加简明易懂。
附图说明
图1为本申请实施例提供的一种用户画像生成装置的硬件结构示意图;
图2为本申请实施例提供的又一种用户画像生成装置的硬件结构示意图;
图3为本申请实施例提供的一种目标模型训练流程示意图;
图4为本申请实施例提供的一种用户画像生成流程示意图;
图5为本申请实施例提供的一种用户画像生成装置的结构示意图;
图6为本申请实施例提供的又一种用户画像生成装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
为了便于清楚描述本申请实施例的技术方案,在本申请实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。
当前,在获取用户画像的过程中,通常会人为设置各个行为(如浏览、搜索、收藏、下单、购买等)的初始权重,然后基于发生这些行为的次数、行为类型的初始权重、时间衰减来计算用户的标签权重,以得到用户画像。但是,由于初始权重是由运营人员或数据分析人员主观给出的,所以,这种确定初始权重的方法主观因素较多,可能无法准确衡量用户的行为模式,进而降低了确定用户画像的准确度。
针对上述问题,本申请实施例提供了一种用户画像生成方法,用户画像生成装置通过预先训练好的目标模型,对终端在第一预设时间段内的一个行为信息的标签特征进行训练,以确定终端的用户的标签特征的权重值,并根据权重值,生成终端的用户画像。相比现有技术,本申请实施例提供的方案解决了在获取用户画像的过程中,如何准确的确定用户各个行为的权重的技术问题,提高了确定用户画像的准确度。
上述用户画像生成装置可以为用于对用户画像生成的设备,也可以为该设备中的芯片,还可以为该设备中的片上系统。
可选的,该设备可以是物理机,例如:台式电脑,又称台式机或桌面机(desktopcomputer)、手机、平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personalcomputer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等终端设备。
可选的,上述用户画像生成装置也可以通过部署在物理机上的虚拟机(virtualmachine,VM),实现上述用户画像生成装置所要实现的功能。
为了便于理解,下面对本申请实施例中的用户画像生成装置的结构进行描述。
图1示出了本申请实施例提供的用户画像生成装置的一种硬件结构示意图。如图1所示,该用户画像生成装置包括处理器11,存储器12、通信接口13、总线14。处理器11,存储器12以及通信接口13之间可以通过总线14连接。
处理器11是用户画像生成装置的控制中心,可以是一个处理器,也可以是多个处理元件的统称。例如,处理器11可以是一个通用中央处理单元(central processing unit,CPU),也可以是其他通用处理器等。其中,通用处理器可以是微处理器或者是任何常规的处理器等。
作为一种实施例,处理器11可以包括一个或多个CPU,例如图1中所示的CPU 0和CPU 1。
存储器12可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
一种可能的实现方式中,存储器12可以独立于处理器11存在,存储器12可以通过总线14与处理器11相连接,用于存储指令或者程序代码。处理器11调用并执行存储器12中存储的指令或程序代码时,能够实现本发明实施例提供的用户画像生成方法。
另一种可能的实现方式中,存储器12也可以和处理器11集成在一起。
通信接口13,用于与其他设备通过通信网络连接。所述通信网络可以是以太网,无线接入网,无线局域网(wireless local area networks,WLAN)等。通信接口13可以包括用于接收数据的接收单元,以及用于发送数据的发送单元。
总线14,可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图1中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
需要指出的是,图1示出的结构并不构成对该用户画像生成装置的限定。除图1所示部件之外,该用户画像生成装置可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
图2示出了本申请实施例中用户画像生成装置的另一种硬件结构。如图2所示,通信装置可以包括处理器21以及通信接口22。处理器21与通信接口22耦合。
处理器21的功能可以参考上述处理器11的描述。此外,处理器21还具备存储功能,可以参考上述存储器12的功能。
通信接口22用于为处理器21提供数据。该通信接口22可以是通信装置的内部接口,也可以是用户画像生成装置对外的接口(相当于通信接口13)。
需要指出的是,图1(或图2)中示出的结构并不构成对用户画像生成装置的限定,除图1(或图2)所示部件之外,该用户画像生成装置可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合附图对本申请实施例提供的用户画像生成方法进行详细介绍。
本申请实施例提供的用户画像生成方法包括:用户画像生成装置根据第二预设时间段内多个训练终端的多个标签特征和预设的细菌觅食算法,训练得到目标模型的流程(简称为“目标模型训练流程”)和用户画像生成装置根据目标模型,确定终端在第一预设时间段内的一个行为信息的标签特征的权重值,并根据权重值生成用户画像的流程(简称为“用户画像生成流程”)。
下面先对“目标模型训练流程”进行描述。
如图3所示,“目标模型训练流程”包括:S301-S307。
S301、用户画像生成装置获取第二预设时间段内的多个训练终端中,每个训练终端的多个标签特征。
具体的,用户画像生成装置可以通过训练终端的行为数据库,获取第二预设时间段内的多个训练终端中,每个训练终端的多个标签特征。
可选的,标签特征可以为行为信息的下属标签。即行为信息为一级标签,标签特征为二级标签。
进一步的,行为信息包括:社交行为信息、购物行为信息或者应用程序使用行为信息中的至少一个。
示例性的,表1示出了一个训练终端的一级标签以及二级标签的部分内容。
表1
Figure BDA0003182833480000071
Figure BDA0003182833480000081
对于任一训练终端而言,用户画像生成装置可以通过同样的方法,获取每个训练终端的标签特征。
进一步地,为了提高计算的准确性,在获取到第二预设时间段内的多个训练终端中,每个训练终端的多个标签特征后,用户画像生成装置根据等频分箱法对获取到的标签特征进行归一化处理,以及异常值的删除。
S302、用户画像生成装置随机生成S个模型。
本申请实施例涉及到的模型均可以在获取到训练终端的标签特征后,根据该标签特征确定该训练终端的标签特征的权重值。
可选的,模型的输出端采用数值(如权重值)表示终端的标签特征的权重值。
可选的,本申请实施例根据极端梯度提升(extreme gradient boosting,XGBOOST)算法构建S个模型。
一般的,采用XGBOOST算法构建的模型包含多个参数(以包括Q个参数为例)。这里,采用向量X表示模型中的Q个参数:X={X1,…,Xi,…XQ}。其中,X1表示第1个参数,Xi表示第i个参数,XQ表示第Q个参数。向量X中每个参数的取值可以有多个。Q个参数中每个参数的定义及取值范围可以参考现有技术中对XGBOOST算法的描述,这里对此不再进行详细赘述。
用户画像生成装置对Q个参数中的每个参数进行随机取值,以确定出S个向量。S个向量中的任意两个向量不同。这里,采用Xi表示S个向量中的第i个向量:Xi={Xi1,Xi2,…XiQ},1≤i≤S。用户画像生成装置根据确定出的S个向量,生成S个模型,其中,S个向量中的每个向量唯一对应一个模型。
本申请实施例对S301和S302的执行顺序不作限定。可选的,本申请实施例可以先执行S301,后执行S302,也可以先执行S302,后执行S301,还可以同时执行S301和S302,本申请实施例对此不作具体限定。
S303、用户画像生成装置将获取到的第二预设时间段内的多个标签特征输入到S个当前模型中,确定当前目标结果。
需要说明的是,当用户画像生成装置将获取到的第二预设时间段内的多个标签特征,第一次输入到S个当前模型中时,该S个当前模型为上述随机生成的S个模型。
具体的,用户画像生成装置将第二预设时间段内获取到的多个标签特征输入到S个当前模型的每个模型中。结合前面描述可知,模型的输出端采用权重值表示训练终端的标签特征的权重值。因此,将多个标签特征输入到S个当前模型的每个模型中之后,用户画像生成装置可以得到S个当前权重值。然后,用户画像生成装置从得到的S个当前权重值中确定出当前满足预设条件的权重值,并将该权重值作为当前目标结果。
上述用户画像生成装置将获取到的第二预设时间段内的多个标签特征输入到S个当前模型中,确定当前目标结果的具体操作,简称为训练处理操作。
示例性的,当前满足预设条件的权重值可以是数值最大的权重值,也可以是S个当前权重值中,与预设权重值之间的差值最小的权重值。
S304、用户画像生成装置判断当前训练处理操作的执行次数是否小于预设阈值。
可以理解的是,模型的训练通常是一个循环迭代的过程。为了保证确定出的目标模型的稳定性和准确性,用户画像生成装置需要采用训练数据(如本申请实施例中第二预设时间段内的多个标签特征)多次训练模型。本申请实施例中的用户画像生成装置可以在确定出执行训练处理操作的次数(确定当前目标结果的次数或者当前模型的训练次数)等于预设阈值的情况下,停止训练。
相应的,用户画像生成装置每次执行完训练处理操作后,可以判断当前执行训练处理操作的次数是否小于预设阈值。当然,用户画像生成装置也可以判断当前模型的训练次数是否小于预设阈值,或者用户画像生成装置确定当前目标结果的次数是否小于预设阈值。本申请实施例主要以用户画像生成装置判断当前执行训练处理操作的次数是否小于预设阈值为例进行说明。
若用户画像生成装置确定出当前训练处理操作的执行次数小于预设阈值,则继续执行S305。若用户画像生成装置确定出当前训练处理操作的执行次数等于预设阈值,则继续执行S307。
S305、用户画像生成装置根据确定出的当前目标结果和预设的细菌觅食算法,调整S个当前模型中每个模型的参数。
具体的,对于S个当前模型中的第i个模型而言,用户画像生成装置在第J次确定出目标结果后,采用下述公式调整第i个模型中的参数:
Figure BDA0003182833480000101
Figure BDA0003182833480000102
其中,1≤i≤S;0≤J≤预设阈值;r1∈[0,1];r2∈[0,1];
Figure BDA0003182833480000103
表示第J次训练处理操作确定的目标结果;ZJ为S个模型的平均位置,且
Figure BDA0003182833480000104
Figure BDA0003182833480000105
表示在第J+1次执行训练处理操作时,第i个模型的量子旋转角。
需要说明的是,当J=0时,
Figure BDA0003182833480000106
为随机生成的一个向量。
进一步可选的,对于每个模型而言,用户画像生成装置在采用上述公式确定出调整后的参数后,还可以根据细菌觅食算法,对调整后的参数进行繁殖处理和扩散处理,并将经过繁殖处理和扩散处理之后的参数确定为该模型调整后的参数。这里,繁殖处理和扩散处理可以参考现有细菌觅食算法的描述,此处不再进行详细赘述。
S306、用户画像生成装置将调整参数后的S个模型作为S个当前模型,并根据第二预设时间段内的多个标签特征,重复执行S303。
S307、用户画像生成装置确定目标模型。
在用户画像生成装置确定出当前训练处理操作的执行次数等于预设阈值时,用户画像生成装置将当前训练处理操作后,确定的当前目标结果所对应的模型确定为目标模型。
可以看出,用户画像生成装置训练模型的过程为一个迭代过程。用户画像生成装置得到的目标模型能够较为准确、快速的确定出某一终端的标签特征的权重值。
可选的,用户画像生成装置会周期性的根据当前时间段的标签特征,更新目标模型。这样,可有效地避免目标模型未及时更新从而造成模型输出结果的误差,保证了目标模型的时效性,进而保证了目标模型输出结果的准确性。
为了更加清楚的理解上述训练过程,下面结合细菌觅食算法的具体步骤对上述实施例进行描述。
用户画像生成装置可以根据细菌觅食算法确定目标模型,具体的流程为:
S1、用户画像生成装置初始化决策树训练模型的模型数量为细菌觅食算法中细菌的数量S,初始化决策树训练模型的参数数量为细菌的维度Q,则细菌Xi=(Xi1,Xi2,…,XiQ)(i=1,2,…,S)。
S2、用户画像生成装置将S个细菌进行趋化,具体包括:
S2.1、用户画像生成装置根据公式(1)确定S个细菌的平均位置ZJ;公式(1)为:
Figure BDA0003182833480000111
其中,Xi J为细菌Xi第J次趋化后的位置,J≤Q。
S2.2、用户画像生成装置根据S个细菌的平均位置ZJ和公式(2)确定细菌Xi J第J+1次趋化时的量子旋转角δi J+1;公式(2)为:
δi J+1=r1(Xi J-XJ g)+r2(Xi J-ZJ);
其中,r1和r2为自定义系数,当J>1时,XJ g为第J-1次的最优细菌,当J=1时,XJ g为S个细菌中除细菌Xi以外的任意一个细菌。
S2.3、用户画像生成装置根据细菌Xi J第J+1次趋化时的量子旋转角δi J+1和公式(3)确定细菌Xi J第J+1次趋化后的细菌Xi J+1的位置;公式(3)为:
Figure BDA0003182833480000112
S3、若S个细菌的趋化次数大于或者等于预设趋化次数,则用户画像生成装置将S个细菌进行繁殖,具体包括:
S3.1、用户画像生成装置根据细菌Xi J第J+1次趋化后的细菌Xi J+1的位置确定细菌Xi J+1的适应度。
S3.2、用户画像生成装置判断细菌Xi J+1的适应度是否满足预设条件。
S3.3、若细菌Xi J+1的适应度满足预设繁殖条件,则用户画像生成装置将细菌Xi J+1复制。
S3.4、若细菌Xi J+1的适应度不满足预设繁殖条件,则用户画像生成装置将细菌Xi J+1淘汰。
S4、若S个细菌的繁殖次数大于或者等于预设繁殖次数,则用户画像生成装置将S个细菌进行扩散,具体包括:
S4.1、用户画像生成装置根据公式(4)确定细菌Xi J+1的扩散概率η;公式(4)为:
Figure BDA0003182833480000121
其中,α为突变系数,μ为衰减因子,T为预设扩散次数,t为当前预设扩散次数。
S4.2、若细菌Xi J+1的扩散概率η满足预设扩散条件,则用户画像生成装置将细菌Xi J +1淘汰,并生成一个新的细菌a Xi J+1
S5、若S个细菌的扩散次数大于或者等于预设扩散次数,则用户画像生成装置确定S个细菌的目标函数。
接下来对“用户画像生成流程”进行描述。
采用上述方法训练好目标模型之后,可以根据目标模型,确定标签特征的权重值,并根据权重值,生成终端的用户画像。如图4所示,包括:S401-S403。
S401、用户画像生成装置获取终端在第一预设时间段内的一个行为信息的标签特征。
其中,一个行为信息为社交行为信息、购物行为信息或者应用程序使用行为信息中的任意一个。
用户画像生成装置可以根据上述获取第二预设时间段内的多个训练终端中,每个训练终端的多个标签特征的方法,获取终端在第一预设时间段内的一个行为信息的标签特征,具体方法在此不再赘述。
S402、用户画像生成装置将一个行为信息的标签特征输入到预先训练好的目标模型,以确定标签特征的权重值。
示例性的,用户画像生成装置获取终端在2019年11月份中,连续7天的标签特征。将上述标签特征输入到预先训练好的目标模型,目标模型通过训练上述标签特征,输出权重值为0.7。
又一示例性的,表2示出了一个终端的一级标签、二级标签以及每个二级标签的权重值的部分内容。
表2
Figure BDA0003182833480000131
Figure BDA0003182833480000141
S403、用户画像生成装置根据权重值,生成终端的用户画像。
具体的,在确定标签特征的权重值后,用户画像生成装置可以根据权重值,生成终端的用户画像。
可选的,在确定标签特征的权重值后,用户画像生成装置根据权重值,确定用于生成用户画像的目标权重值。后续,用户画像生成装置根据目标权重值,生成用户画像。用户画像生成装置根据目标权重值,生成用户画像的具体方法可以参考现有技术中,生成用户画像的具体方法,本公开对此不作限定。
其中,目标权重值=标签特征的权重值×时间衰减系数×用户行为次数×TF-IDF。
本申请实施例中提供一种用户画像生成方法,包括:获取终端在第一预设时间段内的一个行为信息的标签特征;一个行为信息为社交行为信息、购物行为信息或者应用程序使用行为信息中的任意一个;将一个行为信息的标签特征输入到预先训练好的目标模型,以确定标签特征的权重值;根据权重值,生成终端的用户画像。
用户画像生成装置通过预先训练好的目标模型,对终端在第一预设时间段内的一个行为信息的标签特征进行训练,以确定终端的用户的标签特征的权重值,并根据权重值,生成终端的用户画像。相比现有技术,本申请实施例提供的方案解决了在获取用户画像的过程中,如何准确的确定用户各个行为的权重的技术问题,提高了确定用户画像的准确度。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本申请实施例可以根据上述方法示例对用户画像生成装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。可选的,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
如图5所示,为本申请实施例提供的一种用户画像生成装置500的结构示意图。该用户画像生成装置500用于解决在获取用户画像的过程中,如何准确的确定用户各个行为的权重的技术问题,例如用于执行图3所示的目标模型训练的方法,或者图4所示的用户画像生成的方法。用户画像生成装置500包括:获取单元501、处理单元502和生成单元503。
获取单元501,用于获取终端在第一预设时间段内的一个行为信息的标签特征;一个行为信息为社交行为信息、购物行为信息或者应用程序使用行为信息中的任意一个。例如,结合图4,获取单元501可以用于执行S401。
处理单元502,用于将一个行为信息的标签特征输入到预先训练好的目标模型,以确定标签特征的权重值。例如,结合图4,处理单元502可以用于执行S402。
生成单元503,用于根据权重值,生成终端的用户画像。例如,结合图4,生成单元503可以用于执行S403。
可选的,如图6所示,该用户画像生成装置500还包括:训练单元504。
训练单元504,用于根据第二预设时间段内多个训练终端的多个标签特征和预设的细菌觅食算法,训练得到目标模型。例如,结合图3,训练单元504可以用于执行S301-S307。
可选的,训练单元504具体用于:
获取第二预设时间段内的多个训练终端中,每个训练终端的多个标签特征;
根据多个标签特征,执行训练处理操作,训练处理操作为:将多个标签特征输入到S个当前模型中,得到S个处理结果,S个处理结果中的每个处理结果唯一对应一个当前模型;从S个处理结果中确定当前目标结果;
在训练处理操作的执行次数小于预设阈值的情况下,根据当前目标结果和预设的细菌觅食算法,调整S个当前模型中每个模型的参数,S为正整数;
将调整参数后的S个模型作为S个当前模型,并根据多个标签特征,重新执行训练处理操作,直到训练处理操作的执行次数等于预设阈值为止;
根据当前目标结果,确定目标模型。
可选的,训练单元504具体用于:
对于S个模型中的第i个模型而言,在第J次训练处理操作执行结束后,采用下述公式调整第i个模型中的参数:
Figure BDA0003182833480000161
Figure BDA0003182833480000162
其中,1≤i≤S;0≤J≤预设阈值;r1∈[0,1];r2∈[0,1];
Figure BDA0003182833480000163
表示第J次训练处理操作确定的目标结果;ZJ为S个模型的平均位置,且
Figure BDA0003182833480000164
Figure BDA0003182833480000165
表示在第J+1次执行训练处理操作时,第i个模型的量子旋转角。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质包括计算机执行指令。当计算机执行指令在计算机上运行时,使得计算机执行如上述实施例提供的用户画像生成方法中,用户画像生成装置执行的各个步骤。
本申请实施例还提供一种计算机程序产品,该计算机程序产品可直接加载到存储器中,并含有软件代码,该计算机程序产品经由计算机载入并执行后能够实现上述实施例提供的用户画像生成方法中,用户画像生成装置执行的各个步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种用户画像生成方法,其特征在于,包括:
获取终端在第一预设时间段内的一个行为信息的标签特征;所述一个行为信息为社交行为信息、购物行为信息或者应用程序使用行为信息中的任意一个;
将所述一个行为信息的标签特征输入到预先训练好的目标模型,以确定所述标签特征的权重值;
根据所述权重值,生成所述终端的用户画像。
2.根据权利要求1所述的用户画像生成方法,其特征在于,所述用户画像生成方法还包括:
根据第二预设时间段内多个训练终端的多个标签特征和预设的细菌觅食算法,训练得到所述目标模型。
3.根据权利要求2所述的用户画像生成方法,其特征在于,所述根据第二预设时间段内多个训练终端的多个标签特征和预设的细菌觅食算法,训练得到所述目标模型,包括:
获取所述第二预设时间段内的所述多个训练终端中,每个训练终端的多个标签特征;
根据所述多个标签特征,执行训练处理操作,所述训练处理操作为:将所述多个标签特征输入到S个当前模型中,得到S个处理结果,所述S个处理结果中的每个处理结果唯一对应一个当前模型;从所述S个处理结果中确定当前目标结果,S为正整数;
在所述训练处理操作的执行次数小于预设阈值的情况下,根据所述当前目标结果和所述预设的细菌觅食算法,调整所述S个当前模型中每个模型的参数;
将调整参数后的S个模型作为所述S个当前模型,并根据所述多个标签特征,重新执行所述训练处理操作,直到所述训练处理操作的执行次数等于所述预设阈值为止;
根据所述当前目标结果,确定所述目标模型。
4.根据权利要求3所述的用户画像生成方法,其特征在于,所述根据所述当前目标结果和所述预设的细菌觅食算法,调整所述S个当前模型中每个模型的参数,包括:
对于所述S个模型中的第i个模型而言,在第J次训练处理操作执行结束后,采用下述公式调整所述第i个模型中的参数:
Figure FDA0003182833470000011
Figure FDA0003182833470000021
其中,1≤i≤S;0≤J≤所述预设阈值;r1∈[0,1];r2∈[0,1];
Figure FDA0003182833470000022
表示所述第J次训练处理操作确定的目标结果;ZJ为所述S个模型的平均位置,且
Figure FDA0003182833470000023
Figure FDA0003182833470000024
表示在第J+1次执行所述训练处理操作时,所述第i个模型的量子旋转角。
5.一种用户画像生成装置,其特征在于,包括:获取单元,处理单元和生成单元;
所述获取单元,用于获取终端在第一预设时间段内的一个行为信息的标签特征;所述一个行为信息为社交行为信息、购物行为信息或者应用程序使用行为信息中的任意一个;
所述处理单元,用于将所述一个行为信息的标签特征输入到预先训练好的目标模型,以确定所述标签特征的权重值;
所述生成单元,用于根据所述权重值,生成所述终端的用户画像。
6.根据权利要求5所述的用户画像生成装置,其特征在于,所述处理单元,还用于:
根据第二预设时间段内多个训练终端的多个标签特征和预设的细菌觅食算法,训练得到所述目标模型。
7.根据权利要求6所述的用户画像生成装置,其特征在于,所述处理单元,具体用于:
获取所述第二预设时间段内的所述多个训练终端中,每个训练终端的多个标签特征;
根据所述多个标签特征,执行训练处理操作,所述训练处理操作为:将所述多个标签特征输入到S个当前模型中,得到S个处理结果,所述S个处理结果中的每个处理结果唯一对应一个当前模型;从所述S个处理结果中确定当前目标结果;
在所述训练处理操作的执行次数小于预设阈值的情况下,根据所述当前目标结果和所述预设的细菌觅食算法,调整所述S个当前模型中每个模型的参数,S为正整数;
将调整参数后的S个模型作为所述S个当前模型,并根据所述多个标签特征,重新执行所述训练处理操作,直到所述训练处理操作的执行次数等于所述预设阈值为止;
根据所述当前目标结果,确定所述目标模型。
8.根据权利要求7所述的用户画像生成装置,其特征在于,所述处理单元,具体用于:
对于所述S个模型中的第i个模型而言,在第J次训练处理操作执行结束后,采用下述公式调整所述第i个模型中的参数:
Figure FDA0003182833470000031
Figure FDA0003182833470000032
其中,1≤i≤S;0≤J≤所述预设阈值;r1∈[0,1];r2∈[0,1];
Figure FDA0003182833470000033
表示所述第J次训练处理操作确定的目标结果;ZJ为所述S个模型的平均位置,且
Figure FDA0003182833470000034
Figure FDA0003182833470000035
表示在第J+1次执行所述训练处理操作时,所述第i个模型的量子旋转角。
9.一种用户画像生成装置,其特征在于,包括存储器和处理器;所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过总线连接;
当所述用户画像生成装置运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述用户画像生成装置执行如权利要求1-4任一项所述的用户画像生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机执行指令,当所述计算机执行指令在计算机上运行时,使得所述计算机执行如权利要求1-4任一项所述的用户画像生成方法。
CN202110852383.5A 2021-07-27 2021-07-27 一种用户画像生成方法及装置 Pending CN113592590A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110852383.5A CN113592590A (zh) 2021-07-27 2021-07-27 一种用户画像生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110852383.5A CN113592590A (zh) 2021-07-27 2021-07-27 一种用户画像生成方法及装置

Publications (1)

Publication Number Publication Date
CN113592590A true CN113592590A (zh) 2021-11-02

Family

ID=78250710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110852383.5A Pending CN113592590A (zh) 2021-07-27 2021-07-27 一种用户画像生成方法及装置

Country Status (1)

Country Link
CN (1) CN113592590A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114066294A (zh) * 2021-11-24 2022-02-18 北京京东乾石科技有限公司 车队安全画像生成方法和装置
WO2024114596A1 (zh) * 2022-11-30 2024-06-06 天翼数字生活科技有限公司 用于确定终端画像的方法、系统和计算机可读介质
CN118228159A (zh) * 2024-04-09 2024-06-21 北京博瑞彤芸科技股份有限公司 基于用户画像监控异常用户的方法、装置及相关介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105420760A (zh) * 2015-11-06 2016-03-23 重庆科技学院 基于自适应步长细菌觅食算法的铝电解生产过程多目标优化方法
CN109213802A (zh) * 2018-08-16 2019-01-15 北京百度网讯科技有限公司 用户画像构建方法、装置、终端和计算机可读存储介质
CN109359244A (zh) * 2018-10-30 2019-02-19 中国科学院计算技术研究所 一种个性化信息推荐方法和装置
CN110378731A (zh) * 2016-04-29 2019-10-25 腾讯科技(深圳)有限公司 获取用户画像的方法、装置、服务器及存储介质
CN111047425A (zh) * 2019-11-25 2020-04-21 中国联合网络通信集团有限公司 一种行为预测方法及装置
CN112560996A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 用户画像识别模型训练方法、设备、可读存储介质及产品
CN112801716A (zh) * 2021-02-20 2021-05-14 中国联合网络通信集团有限公司 一种套餐预测方法及装置
CN113033755A (zh) * 2021-03-08 2021-06-25 沈阳大学 一种具有韦伯-费克纳情绪化突变操作的细菌觅食寻优方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105420760A (zh) * 2015-11-06 2016-03-23 重庆科技学院 基于自适应步长细菌觅食算法的铝电解生产过程多目标优化方法
CN110378731A (zh) * 2016-04-29 2019-10-25 腾讯科技(深圳)有限公司 获取用户画像的方法、装置、服务器及存储介质
CN109213802A (zh) * 2018-08-16 2019-01-15 北京百度网讯科技有限公司 用户画像构建方法、装置、终端和计算机可读存储介质
CN109359244A (zh) * 2018-10-30 2019-02-19 中国科学院计算技术研究所 一种个性化信息推荐方法和装置
CN111047425A (zh) * 2019-11-25 2020-04-21 中国联合网络通信集团有限公司 一种行为预测方法及装置
CN112560996A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 用户画像识别模型训练方法、设备、可读存储介质及产品
CN112801716A (zh) * 2021-02-20 2021-05-14 中国联合网络通信集团有限公司 一种套餐预测方法及装置
CN113033755A (zh) * 2021-03-08 2021-06-25 沈阳大学 一种具有韦伯-费克纳情绪化突变操作的细菌觅食寻优方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114066294A (zh) * 2021-11-24 2022-02-18 北京京东乾石科技有限公司 车队安全画像生成方法和装置
WO2024114596A1 (zh) * 2022-11-30 2024-06-06 天翼数字生活科技有限公司 用于确定终端画像的方法、系统和计算机可读介质
CN118228159A (zh) * 2024-04-09 2024-06-21 北京博瑞彤芸科技股份有限公司 基于用户画像监控异常用户的方法、装置及相关介质

Similar Documents

Publication Publication Date Title
US20210326729A1 (en) Recommendation Model Training Method and Related Apparatus
CN113592590A (zh) 一种用户画像生成方法及装置
TWI743428B (zh) 目標用戶群體的確定方法和裝置
Tsiotas Detecting different topologies immanent in scale-free networks with the same degree distribution
CN108829808B (zh) 一种页面个性化排序方法、装置及电子设备
EP4181026A1 (en) Recommendation model training method and apparatus, recommendation method and apparatus, and computer-readable medium
US20210311751A1 (en) Machine-learning models applied to interaction data for determining interaction goals and facilitating experience-based modifications to interface elements in online environments
WO2016008383A1 (en) Application recommendation method and application recommendation apparatus
TWI536284B (zh) 針對線上店面之聲譽評分
CN111080397A (zh) 信用评估方法、装置及电子设备
CN112085615B (zh) 图神经网络的训练方法及装置
CN106874416A (zh) 排行榜单生成方法及排行榜单生成装置
CN110995459A (zh) 异常对象识别方法、装置、介质及电子设备
CN111047425A (zh) 一种行为预测方法及装置
WO2023000491A1 (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
CN106651427B (zh) 基于用户行为的数据关联方法
CN111695084A (zh) 模型生成方法、信用评分生成方法、装置、设备及存储介质
US10474688B2 (en) System and method to recommend a bundle of items based on item/user tagging and co-install graph
CN116910373B (zh) 房源推荐方法、装置、电子设备及存储介质
CN113627513A (zh) 一种训练数据生成方法、系统、电子设备及存储介质
CN107403352B (zh) 对根据产品评估确定的感兴趣主题进行优先级排序
CN110262906B (zh) 接口标签推荐方法、装置、存储介质和电子设备
CN110941714A (zh) 分类规则库构建方法、应用分类方法及装置
Motte Mathematical models for large populations, behavioral economics, and targeted advertising
CN111861635B (zh) 一种针对商品分享时的好友推荐方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211102

RJ01 Rejection of invention patent application after publication