CN112001754A - 用户画像生成方法、装置、设备及计算机可读介质 - Google Patents

用户画像生成方法、装置、设备及计算机可读介质 Download PDF

Info

Publication number
CN112001754A
CN112001754A CN202010851691.1A CN202010851691A CN112001754A CN 112001754 A CN112001754 A CN 112001754A CN 202010851691 A CN202010851691 A CN 202010851691A CN 112001754 A CN112001754 A CN 112001754A
Authority
CN
China
Prior art keywords
target object
transaction
target
data
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010851691.1A
Other languages
English (en)
Inventor
方依
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Second Picket Network Technology Co ltd
Original Assignee
Shanghai Fengzhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Fengzhi Technology Co ltd filed Critical Shanghai Fengzhi Technology Co ltd
Priority to CN202010851691.1A priority Critical patent/CN112001754A/zh
Publication of CN112001754A publication Critical patent/CN112001754A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及一种用户画像生成方法、装置、设备及计算机可读介质。该方法包括:获取待处理数据,待处理数据为目标对象在目标平台上的行为所产生的数据;利用待处理数据确定目标对象的属性标签,属性标签用于表示目标对象的特征信息;根据属性标签生成目标对象的用户画像。本方案将用户的行为,包括消费行为、商品操作行为等数据用于构建用户画像,能够从用户的消费行为层面更加准确地揭示用户本质特征,从而生成更加具体化的用户画像,最终能够向用户推荐更符合用户个性化的商品。

Description

用户画像生成方法、装置、设备及计算机可读介质
技术领域
本申请涉及用户画像技术领域,尤其涉及一种用户画像生成方法、装置、设备及计算机可读介质。
背景技术
随着互联网技术及电子商务的快速发展,在线购物已经成为最主要的购物方式之一。商品的销售方、购物平台的运营方为了吸引用户,特别是为了给予用户个性化的购物体验,需要根据每个用户的行为特点、消费习惯、兴趣爱好向每个用户推荐特定的商品,由此产生了推荐系统。构建推荐系统的核心任务之一在于如何准确地分析出用户的兴趣特点,也即用户画像。
目前,相关技术中,常常以用户的年龄、性别、职业、收入作为用户的属性标签,但以此生成的用户画像特征过于宽泛,不能有力的揭示用户的本质特征。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供了一种用户画像生成方法、装置、设备及计算机可读介质,以解决如何生成揭示用户消费行为本质特征的用户画像的技术问题。
第一方面,本申请提供了一种用户画像生成方法,包括:获取待处理数据,待处理数据为目标对象在目标平台上的行为所产生的数据;利用待处理数据确定目标对象的属性标签,属性标签用于表示目标对象的特征信息;根据属性标签生成目标对象的用户画像。
可选地,利用待处理数据确定目标对象的属性标签包括:利用目标对象在目标平台上的交易数据确定目标对象的交易标签;和/或,利用目标对象在目标平台上的商品操作数据确定目标对象的人口统计标签;待处理数据包括交易数据和商品操作数据,属性标签包括交易标签和人口统计标签。
可选地,利用目标对象在目标平台上的交易数据确定目标对象的交易标签包括:确定目标对象在目标平台上的末次交易时间、在目标时间范围内的交易频率及在目标时间范围内的交易金额,交易数据包括末次交易时间、交易频率及交易金额;将末次交易时间、交易频率及交易金额分别与其对应的均值进行对比,得到对比结果;利用对比结果得到目标序列,目标序列用于对目标对象进行价值评估;确定与目标序列匹配的价值标签,交易标签包括价值标签。
可选的,利用目标对象在目标平台上的交易数据确定目标对象的交易标签还包括:在未查询到目标对象在目标平台的交易记录的情况下,将目标对象的交易标签确定为第一标签;在查询到目标对象在目标平台的交易记录且当前时间距离末次交易的时间间隔大于第一间隔的情况下,将目标对象的交易标签确定为第二标签,第一间隔为交易记录中相邻两次交易之间的最大时间间隔与预设倍数的乘积;在查询到目标对象在目标平台的交易记录且当前时间距离末次交易的时间间隔小于等于第一间隔的情况下,将目标对象的交易标签确定为第三标签。
可选地,利用目标对象在目标平台上的交易数据确定目标对象的交易标签还包括:确定时间窗口,时间窗口用于划分时间区间;将目标时间区间按照时间窗口进行划分;获取目标时间区间内每个时间窗口中产生的交易次数;利用交易次数确定各个时间窗口中目标对象的忠诚度标签,交易标签包括忠诚度标签。
可选地,利用目标对象在目标平台上的商品操作数据确定目标对象的人口统计标签包括:对商品标题进行分词,得到商品标题的词集合,商品标题为目标对象在目标平台上浏览和/或交易的商品的标题,商品操作数据包括商品标题;将词集合中的词语转换为词向量;利用第一神经网络模型提取词向量的局部特征,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据中的特征信息;确定多个局部特征的注意力权重,并获取多个局部特征与对应的注意力权重的乘积的和,得到商品标题的特征向量;利用特征向量确定目标对象的人口统计标签。
可选地,利用待处理数据确定目标对象的属性标签还包括:确定目标对象在多个目标页面的停留时间,目标页面为目标平台上的活动页面,待处理数据包括停留时间;对多个目标页面的停留时间从长到短进行排序,得到第一序列,第一序列用于表示目标对象的偏好活动的类别;将第一序列作为目标对象的兴趣标签,属性标签包括兴趣标签。
第二方面,本申请提供了一种用户画像生成装置,包括:数据获取模块,用于获取待处理数据,待处理数据为目标对象在目标平台上的行为所产生的数据;标签确定模块,用于利用待处理数据确定目标对象的属性标签,属性标签用于表示目标对象的特征信息;画像生成模块,用于根据属性标签生成目标对象的用户画像。
第三方面,本申请提供了一种计算机设备,包括存储器、处理器,存储器中存储有可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述第一方面任一项方法的步骤。
第四方面,本申请还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行上述第一方面任一方法。
本申请实施例提供的上述技术方案与相关技术相比具有如下优点:
本申请技术方案为获取待处理数据,待处理数据为目标对象在目标平台上的行为所产生的数据;利用待处理数据确定目标对象的属性标签,属性标签用于表示目标对象的特征信息;根据属性标签生成目标对象的用户画像。本方案将用户的行为,包括消费行为、商品操作行为等数据用于构建用户画像,能够从用户的消费行为层面更加准确地揭示用户本质特征,从而生成更加具体化的用户画像,最终能够向用户推荐更符合用户个性化的商品。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例提供的一种可选的用户画像生成方法硬件环境示意图;
图2为根据本申请实施例提供的一种可选的用户画像生成方法流程图;
图3为根据本申请实施例提供的一种可选的标签确定方法流程图;
图4为根据本申请实施例提供的一种可选的标签确定方法流程图;
图5为根据本申请实施例提供的一种可选的标签确定方法流程图;
图6为根据本申请实施例提供的一种可选的标签确定方法流程图;
图7为根据本申请实施例提供的一种可选的用户画像生成装置框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地使用。
相关技术中,常常以用户的年龄、性别、职业、收入作为用户的属性标签,但以此生成的用户画像特征过于宽泛,不能有力的揭示用户的本质特征。
为解决背景技术中提及的技术问题,根据本申请实施例的一方面,提供了一种用户画像生成方法的实施例。
可选地,在本申请实施例中,上述用户画像生成方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务,可在服务器上或独立于服务器设置数据库105,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101包括但不限于PC、手机、平板电脑等。
本申请实施例中的一种用户画像生成方法可以由服务器103来执行,还可以是由服务器103和终端101共同执行,如图2所示,该方法可以包括以下步骤:
步骤S202,获取待处理数据,待处理数据为目标对象在目标平台上的行为所产生的数据。
本申请实施例中,上述目标平台可以是电商平台、软件平台等,上述待处理数据可以是用户在上述电商平台、软件中对商品进行操作等行为生成的数据,上述行为可以是购买、收藏、退换货,以及浏览、将商品添加到购物车、将商品从购物车删除等,上述行为生成的数据可以包括上述行为信息,还可以包括上述行为产生的时间、交易金额等。上述待处理数据还可以是用户在注册电商平台、软件时填写的身份信息等数据。
步骤S204,利用待处理数据确定目标对象的属性标签,属性标签用于表示目标对象的特征信息。
本申请实施例中,可以利用购买、收藏、退换货,以及浏览、将商品添加到购物车、将商品从购物车删除等用户行为产生行为信息数据、时间、交易金额等确定用户的个性化标签,尤其是表征用户的消费属性的标签。
步骤S206,根据属性标签生成目标对象的用户画像。
本申请实施例中,根据上述用户个性化标签,尤其是表征用户消费属性的标签可以生成表征用户独特消费行为习惯的用户画像。
本方案将用户的行为,包括消费行为、商品操作行为等数据用于构建用户画像,能够从用户的消费行为层面更加准确地揭示用户本质特征,从而生成表征用户独特消费行为习惯的用户画像,最终能够向用户推荐更符合用户个性化的商品。
可选地,利用待处理数据确定目标对象的属性标签包括:利用目标对象在目标平台上的交易数据确定目标对象的交易标签;和/或,利用目标对象在目标平台上的商品操作数据确定目标对象的人口统计标签;待处理数据包括交易数据和商品操作数据,属性标签包括交易标签和人口统计标签。
本申请实施例中,可以根据用户消费行为可以确定表征用户消费属性的交易标签,还可以根据用户对商品浏览、点击、收藏等操作确定用户的人口统计标签。
本方案不仅可以确定表征用户消费属性的交易标签,还可以通过用户对商品的操作来分析用户的行为习惯,甚至分析用户的年龄层次(青年、中年、老年)、性别、兴趣爱好等特征。由于用户对于个人隐私数据的保护,在注册时该部分数据的填充率,且很多都是假数据,比如有些男性会将性别设置为女性;有些人会将地区设置为冰岛等并非本人所在的区域等。因此可以采用神经网络模型、大数据分析等方式分析用户的个人特征,即上述人口统计标签。
下面首先对确定表征用户消费属性的交易标签进行说明。
可选地,如图3所示,利用目标对象在目标平台上的交易数据确定目标对象的交易标签还包括以下步骤:
步骤S302,确定目标对象在目标平台上的末次交易时间、在目标时间范围内的交易频率及在目标时间范围内的交易金额,交易数据包括末次交易时间、交易频率及交易金额。
本申请实施例中,用户的消费属性即可以表示用户的价值,用户价值的多少可以决定电商平台、商家维护该用户的投入程度。
为了确定用户的价值,可以采用RFM模型,即由上述末次交易时间(Recency)、交易频率(Frequency)及交易金额(Monetary)来表示。
步骤S304,将末次交易时间、交易频率及交易金额分别与其对应的均值进行对比,得到对比结果。
步骤S306,利用对比结果得到目标序列,目标序列用于对目标对象进行价值评估。
步骤S308,确定与目标序列匹配的价值标签,交易标签包括价值标签。
本申请实施例中,可以利用上述末次交易时间、交易频率及交易金额分别与其对应的均值进行对比的对比结果得到R-F-M序列。例如,确定R值时,可以将各个用户的末次交易时间与统计时间内末次交易时间的均值进行对比,大于均值说明用户最后一次消费的时间在该项的平均值之内,用户价值较高,则可以确定R=1。反之,小于均值则说明在该项上用户价值较低,可以确定R=0。
确定F值时,可以将各个用户的交易频率与统计时间内交易频率的均值进行对比,大于均值说明用户的交易频率较高,用户价值较大,相应的可以确定F=1。反之,小于均值说明用户的交易频率较低,用户价值较小,可以确定F=0。
确定M值时,可以将各个用户的交易金额与统计时间内交易金额的均值进行对比,大于均值说明用户的购买力较高,用户价值较高,相应的可以确定M=1。反之,小于均值说明用户的购买力较小,用户价值较低,可以确定M=0。
本申请实施例中,通过R-F-M序列,可以综合的分析该用户的价值。例如,000表示用户在三个项上都不具有价值或具有较低的价值,综合分析可以作为价值最小的用户,即流失客户,111表示用户在三个项上都具有较高的价值,增和分析可以作为价值最高的用户,即重要价值客户。其它序列还可以是:010,表示虽然最后一次消费距今时间已经较长,且消费金额小于平均值,但该用户消费频率较高,可以作为一般维持客户;100,表示消费频率和消费金额都较少,但最后一次消费时间距今较近,可以作为新客户;110,表示除了消费金额较少,其它两项价值都较高,可以作为潜力客户;001,表示用户虽然很长时间没有消费且消费频率较低,但是该用户的消费金额超出平均值,购买力较高,可以作为重要挽留客户;101,表示虽然消费频率较低,但是其它两项价值较高,可以作为重要深耕客户;011,表示消费频率和消费金额都较高,只是较长时间没有进行消费,因此可以作为重要唤回客户。
商家对于新客户、老客户及流失客户可以有不同的推荐内容和优惠内容,准确识别客户属性也能够使得用户体验更好。
可选的,利用目标对象在目标平台上的交易数据确定目标对象的交易标签还包括:
在未查询到目标对象在目标平台的交易记录的情况下,将目标对象的交易标签确定为第一标签。
本申请实施例中,若该用户从未在当前电商平台、软件上进行过消费,则可以确定该用户为新用户,上述第一标签即表示该用户为新用户。
在查询到目标对象在目标平台的交易记录且当前时间距离末次交易的时间间隔大于第一间隔的情况下,将目标对象的所述交易标签确定为第二标签,第一间隔为交易记录中相邻两次交易之间的最大时间间隔与预设倍数的乘积。
本申请实施例中,若用户在当前电商平台、软件中有过消费记录,但是已经很长时间没有进行消费了,则可以将该用户确定为流式用户。还可以根据用户两次消费之间的时间间隔来判断,例如相邻两次消费的时间间隔较长,超出了上述第一间隔的情况下,可以将该用户确定为流式用户。上述第一间隔可以是根据实际情况或根据需要设置的,作为优选,可以设置基础间隔,将两次消费的时间间隔与基础间隔或基础间隔的倍数进行对比,从而可以确定该用户的流失等级。
在查询到目标对象在目标平台的交易记录且当前时间距离末次交易的时间间隔小于等于第一间隔的情况下,将目标对象的交易标签确定为第三标签。
本申请实施例中,若用户近期内有消费记录,则表明该用户已经成为老用户,上述第三标签即表示该用户为老用户。
本申请技术方案还可以根据用户的消费行为确定用户的忠诚度标签,下面对于如何确定用户的忠诚度标签进行说明。
可选地,如图4所示,利用目标对象在目标平台上的交易数据确定目标对象的交易标签还包括以下步骤:
步骤S402,确定时间窗口,时间窗口用于划分时间区间。
步骤S404,将目标时间区间按照时间窗口进行划分。
步骤S406,获取目标时间区间内每个时间窗口中产生的交易次数。
步骤S408,利用交易次数确定各个时间窗口中目标对象的忠诚度标签,交易标签包括忠诚度标签。
本申请实施例中,可以对不同时间断用户的消费行为确定相应时间段下该用户的忠诚度。例如,要确定用户在一年内的忠诚度变化,则可以获取该用户一年内所有的消费记录,根据时间窗口将一年划分为多个时间段,例如时间窗口为3个月,则划分出用户在各个季度的忠诚度变化,若时间窗口为1个月,则可以确定用户在各个月份产生的忠诚度变化。每个时间窗口的忠诚度可以是一个时间窗口内消次数与消费次数加1的比值,还可以根据实际情况进行设置。或者,还可以根据各个时间窗口的忠诚度确定总体的忠诚度,例如可以将各个时间窗口得到的忠诚度累加,得到该总体的忠诚度。
本申请实施例中,关于用户消费属性的交易标签,还可以是用户一年内(或其它时间段)总消费金额、总消费次数、最大消费金额、平均消费金额、平均消费间隔及最大消费间隔等。统计用户的最大消费金额可以预估用户能够承受的商品最大价格,例如可以在用户最大消费金额的基础上上浮10%到30%。
还可以对用户浏览商品的时长、访问电商平台、软件及小程序的时长确定属性标签。例如,单次会话时间较短(可以是1分钟),则该用户有可能是机器人,需要进一步识别。而单次会话时间较长(可以是30分钟),则可以认定为二次会话,因为用户可能中途去做其它事情了。
本申请实施例中,还可以将用户退货商品数与用户总的购买商品数的比值作为该用户的退货率。
本申请实施例中,还可以将用户分享的商品数与用户总操作的商品数的比值作为该用户的分享率。
本申请实施例中,还可以根据用户使用电商平台、软件及小程序的时间确定该用户一段时间内的活跃次数,进而分析工作日和周末的活跃频率。
采用本申请技术方案,可以根据用户的消费行为确定用户的交易标签,使得商家在对不同用户进行商品推荐时可以根据个性化,提高用户体验。
下面对确定用户的人口统计标签进行说明。
可选地,如图5所示,利用目标对象在目标平台上的商品操作数据确定目标对象的人口统计标签还包括以下步骤:
步骤S502,对商品标题进行分词,得到商品标题的词集合,商品标题为目标对象在目标平台上浏览和/或交易的商品的标题,商品操作数据包括商品标题。
步骤S504,将词集合中的词语转换为词向量。
步骤S506,利用第一神经网络模型提取词向量的局部特征,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据中的特征信息。
步骤S508,确定多个局部特征的注意力权重,并获取多个局部特征与对应的注意力权重的乘积的和,得到商品标题的特征向量。
步骤S510,利用特征向量确定目标对象的人口统计标签。
本申请实施例中,可以收集用户点击、浏览、收藏等操作执行的商品的商品标题,来分析用户的人口统计标签。首先可以采用自然语言处理技术将商品标题分词,并将所得词汇组成集合,再将词汇进行embedding操作,使之映射到低维空间,并可以通过卷积神经网络模型提取词语的局部特征。其中,神经网络模型在使用前需要使用训练数据对神经网络模型进行训练,训练数据中包括有标注的数据样本。可以通过用户的行为数据集用户填写的资料标注用户的性别、年龄区间等。通过卷积神经网络模型提取到词语的局部特征之后,为各个词语添加权重,最后将各个词语的局部特征与权重相乘,累加上述乘积即可得到商品标题的特征向量。上述权重可以根据实际情况设置,可以根据需要进行设置,还可以根据实验结果进行设置。最后根据该商品标题的特征向量预测该用户的性别、年龄区间、职业等人口统计标签。
本申请还可以提取用户的兴趣爱好标签。
可选地,如图6所示,利用待处理数据确定目标对象的属性标签还可以包括以下步骤:
步骤S602,确定目标对象在多个目标页面的停留时间,目标页面为目标平台上的活动页面,待处理数据包括停留时间。
步骤S604,对多个目标页面的停留时间从长到短进行排序,得到第一序列,第一序列用于表示目标对象的偏好活动的类别。
步骤S606,将第一序列作为目标对象的兴趣标签,属性标签包括兴趣标签。
用户在自己喜欢的商品、活动上回停留较长时间。因此可以统计用户在各个不同的活动的时间占据用户操作总时间的占比。记录最受该用户欢迎的几个活动及其时间占比,按照时间占比大小进行排序,排位越靠前表示该用户兴趣越大。
本方案将用户的行为,包括消费行为、商品操作行为等数据用于构建用户画像,能够从用户的消费行为层面更加准确地揭示用户本质特征,从而生成更加具体化的用户画像,最终能够向用户推荐更符合用户个性化的商品。
根据本申请实施例的又一方面,如图7所示,提供了一种用户画像生成装置,包括:数据获取模块701,用于获取待处理数据,待处理数据为目标对象在目标平台上的行为所产生的数据;标签确定模块703,用于利用待处理数据确定目标对象的属性标签,属性标签用于表示目标对象的特征信息;画像生成模块705,用于根据属性标签生成目标对象的用户画像。
需要说明的是,该实施例中的数据获取模块701可以用于执行本申请实施例中的步骤S202,该实施例中的标签确定模块703可以用于执行本申请实施例中的步骤S204,该实施例中的画像生成模块705可以用于执行本申请实施例中的步骤S206。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
可选地,该标签确定模块,还用于:利用目标对象在目标平台上的交易数据确定目标对象的交易标签;和/或,利用目标对象在目标平台上的商品操作数据确定目标对象的人口统计标签;待处理数据包括交易数据和商品操作数据,属性标签包括交易标签和人口统计标签。
可选地,该用户画像生成装置,还包括:第一确定模块,用于确定目标对象在目标平台上的末次交易时间、在目标时间范围内的交易频率及在目标时间范围内的交易金额,交易数据包括末次交易时间、交易频率及交易金额;均值对比模块,用于将末次交易时间、交易频率及交易金额分别与其对应的均值进行对比,得到对比结果;序列生成模块,用于利用对比结果得到目标序列,目标序列用于对目标对象进行价值评估;第二确定模块,用于确定与目标序列匹配的价值标签,交易标签包括价值标签。
可选地,该用户画像生成装置,还包括:第三确定模块,用于在未查询到目标对象在目标平台的交易记录的情况下,将目标对象的交易标签确定为第一标签;第四确定模块,用于在查询到目标对象在目标平台的交易记录且当前时间距离末次交易的时间间隔大于第一间隔的情况下,将目标对象的交易标签确定为第二标签,第一间隔为交易记录中相邻两次交易之间的最大时间间隔与预设倍数的乘积;第五确定模块,用于在查询到目标对象在目标平台的交易记录且当前时间距离末次交易的时间间隔小于等于第一间隔的情况下,将目标对象的交易标签确定为第三标签。
可选地,该用户画像生成装置,还包括:第六确定模块,用于确定时间窗口,时间窗口用于划分时间区间;时间划分模块,用于将目标时间区间按照时间窗口进行划分;第一获取模块,用于获取目标时间区间内每个时间窗口中产生的交易次数;第七确定模块,用于利用交易次数确定各个时间窗口中目标对象的忠诚度标签,交易标签包括忠诚度标签。
可选地,该用户画像生成装置,还包括:分词模块,用于对商品标题进行分词,得到商品标题的词集合,商品标题为目标对象在目标平台上浏览和/或交易的商品的标题,商品操作数据包括商品标题;转换模块,用于将词集合中的词语转换为词向量;特征提取模块,用于利用第一神经网络模型提取词向量的局部特征,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据中的特征信息;第八确定模块,用于确定多个局部特征的注意力权重,并获取多个局部特征与对应的注意力权重的乘积的和,得到商品标题的特征向量;第九确定模块,用于利用特征向量确定目标对象的人口统计标签。
可选地,该用户画像生成装置,还包括:第十确定模块,用于确定目标对象在多个目标页面的停留时间,目标页面为目标平台上的活动页面,待处理数据包括停留时间;排序模块,用于对多个目标页面的停留时间从长到短进行排序,得到第一序列,第一序列用于表示目标对象的偏好活动的类别;第十一确定模块,用于将第一序列作为目标对象的兴趣标签,属性标签包括兴趣标签。
根据本申请实施例的又一方面还提供了一种计算机设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述步骤。
上述计算机设备中的存储器、处理器通过通信总线和通信接口进行通信。所述通信总线可以是外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application SpecificIntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
根据本申请实施例的又一方面还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质。
可选地,在本申请实施例中,计算机可读介质被设置为存储用于所述处理器执行以下步骤的程序代码:
获取待处理数据,待处理数据为目标对象在目标平台上的行为所产生的数据;
利用待处理数据确定目标对象的属性标签,属性标签用于表示目标对象的特征信息;
根据属性标签生成目标对象的用户画像。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本申请实施例在具体实现时,可以参阅上述各个实施例,具有相应的技术效果。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种用户画像生成方法,其特征在于,包括:
获取待处理数据,其中,所述待处理数据为目标对象在目标平台上的行为所产生的数据;
利用所述待处理数据确定所述目标对象的属性标签,其中,所述属性标签用于表示所述目标对象的特征信息;
根据所述属性标签生成所述目标对象的用户画像。
2.根据权利要求1所述的方法,其特征在于,利用所述待处理数据确定所述目标对象的属性标签包括:
利用所述目标对象在所述目标平台上的交易数据确定所述目标对象的交易标签;
和/或,
利用所述目标对象在所述目标平台上的商品操作数据确定所述目标对象的人口统计标签;
其中,所述待处理数据包括所述交易数据和所述商品操作数据,所述属性标签包括所述交易标签和所述人口统计标签。
3.根据权利要求2所述的方法,其特征在于,利用所述目标对象在所述目标平台上的交易数据确定所述目标对象的交易标签包括:
确定所述目标对象在所述目标平台上的末次交易时间、在目标时间范围内的交易频率及在所述目标时间范围内的交易金额,其中,所述交易数据包括所述末次交易时间、所述交易频率及所述交易金额;
将所述末次交易时间、所述交易频率及所述交易金额分别与其对应的均值进行对比,得到对比结果;
利用所述对比结果得到目标序列,其中,所述目标序列用于对所述目标对象进行价值评估;
确定与所述目标序列匹配的价值标签,其中,所述交易标签包括所述价值标签。
4.根据权利要求2所述的方法,其特征在于,利用所述目标对象在所述目标平台上的交易数据确定所述目标对象的交易标签还包括:
在未查询到所述目标对象在所述目标平台的交易记录的情况下,将所述目标对象的所述交易标签确定为第一标签;
在查询到所述目标对象在所述目标平台的交易记录且当前时间距离末次交易的时间间隔大于第一间隔的情况下,将所述目标对象的所述交易标签确定为第二标签,其中,所述第一间隔为所述交易记录中相邻两次交易之间的最大时间间隔与预设倍数的乘积;
在查询到所述目标对象在所述目标平台的交易记录且当前时间距离末次交易的时间间隔小于等于所述第一间隔的情况下,将所述目标对象的所述交易标签确定为第三标签。
5.根据权利要求2所述的方法,其特征在于,利用所述目标对象在所述目标平台上的交易数据确定所述目标对象的交易标签还包括:
确定时间窗口,其中,所述时间窗口用于划分时间区间;
将目标时间区间按照所述时间窗口进行划分;
获取所述目标时间区间内每个所述时间窗口中产生的交易次数;
利用所述交易次数确定各个所述时间窗口中所述目标对象的忠诚度标签,其中,所述交易标签包括所述忠诚度标签。
6.根据权利要求2所述的方法,其特征在于,利用所述目标对象在所述目标平台上的商品操作数据确定所述目标对象的人口统计标签包括:
对商品标题进行分词,得到所述商品标题的词集合,其中,所述商品标题为所述目标对象在所述目标平台上浏览和/或交易的商品的标题,所述商品操作数据包括所述商品标题;
将所述词集合中的词语转换为词向量;
利用第一神经网络模型提取所述词向量的局部特征,其中,所述第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,所述标记信息用于标记所述训练数据中的特征信息;
确定多个所述局部特征的注意力权重,并获取多个所述局部特征与对应的所述注意力权重的乘积的和,得到所述商品标题的特征向量;
利用所述特征向量确定所述目标对象的所述人口统计标签。
7.根据权利要求1至6任一所述的方法,其特征在于,利用所述待处理数据确定所述目标对象的属性标签还包括:
确定所述目标对象在多个目标页面的停留时间,其中,所述目标页面为所述目标平台上的活动页面,所述待处理数据包括所述停留时间;
对所述多个目标页面的所述停留时间从长到短进行排序,得到第一序列,其中,所述第一序列用于表示所述目标对象的偏好活动的类别;
将所述第一序列作为所述目标对象的兴趣标签,其中,所述属性标签包括所述兴趣标签。
8.一种用户画像生成装置,其特征在于,包括:
数据获取模块,用于获取待处理数据,其中,所述待处理数据为目标对象在目标平台上的行为所产生的数据;
标签确定模块,用于利用所述待处理数据确定所述目标对象的属性标签,其中,所述属性标签用于表示所述目标对象的特征信息;
画像生成模块,用于根据所述属性标签生成所述目标对象的用户画像。
9.一种计算机设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求1至7任一所述方法。
CN202010851691.1A 2020-08-21 2020-08-21 用户画像生成方法、装置、设备及计算机可读介质 Pending CN112001754A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010851691.1A CN112001754A (zh) 2020-08-21 2020-08-21 用户画像生成方法、装置、设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010851691.1A CN112001754A (zh) 2020-08-21 2020-08-21 用户画像生成方法、装置、设备及计算机可读介质

Publications (1)

Publication Number Publication Date
CN112001754A true CN112001754A (zh) 2020-11-27

Family

ID=73474075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010851691.1A Pending CN112001754A (zh) 2020-08-21 2020-08-21 用户画像生成方法、装置、设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN112001754A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465598A (zh) * 2020-12-04 2021-03-09 中国移动通信集团黑龙江有限公司 一种用户画像生成方法、装置、设备及计算机存储介质
CN112528632A (zh) * 2020-12-07 2021-03-19 用友网络科技股份有限公司 基于交易数据的企业用户画像的标签确定方法和装置
CN113010727A (zh) * 2021-03-22 2021-06-22 平安科技(深圳)有限公司 直播平台画像的构建方法、装置、设备及存储介质
CN113129096A (zh) * 2021-03-26 2021-07-16 南京石匠网络科技有限公司 一种基于拼中概率的高效成团方法及其系统
CN113407826A (zh) * 2021-06-09 2021-09-17 广州三七极创网络科技有限公司 虚拟商品推荐方法、装置、设备和存储介质
CN113407827A (zh) * 2021-06-11 2021-09-17 广州三七极创网络科技有限公司 基于用户价值分类的信息推荐方法、装置、设备及介质
CN113706236A (zh) * 2021-06-02 2021-11-26 联想(北京)有限公司 一种推荐方法、装置及电子设备
CN114372821A (zh) * 2021-12-31 2022-04-19 金地(集团)股份有限公司 地产销售中的用户行为数据处理方法和系统、介质
CN114648392A (zh) * 2022-05-19 2022-06-21 湖南华菱电子商务有限公司 基于用户画像的产品推荐方法、装置、电子设备及介质
CN114997957A (zh) * 2022-06-14 2022-09-02 中国银行股份有限公司 基于用户画像的消费推荐方法、装置、设备及存储介质
CN117593034A (zh) * 2024-01-17 2024-02-23 湖南三湘银行股份有限公司 基于计算机的用户分类方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330445A (zh) * 2017-05-31 2017-11-07 北京京东尚科信息技术有限公司 用户属性的预测方法和装置
CN109558530A (zh) * 2018-10-23 2019-04-02 深圳壹账通智能科技有限公司 基于数据处理的用户画像自动生成方法和系统
CN110189157A (zh) * 2019-04-16 2019-08-30 再惠(上海)网络科技有限公司 商户管理方法、系统、电子终端、及存储介质
CN110910199A (zh) * 2019-10-16 2020-03-24 中国平安人寿保险股份有限公司 项目信息的排序方法、装置、计算机设备及存储介质
CN111026915A (zh) * 2019-11-25 2020-04-17 Oppo广东移动通信有限公司 视频分类方法、视频分类装置、存储介质与电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330445A (zh) * 2017-05-31 2017-11-07 北京京东尚科信息技术有限公司 用户属性的预测方法和装置
CN109558530A (zh) * 2018-10-23 2019-04-02 深圳壹账通智能科技有限公司 基于数据处理的用户画像自动生成方法和系统
CN110189157A (zh) * 2019-04-16 2019-08-30 再惠(上海)网络科技有限公司 商户管理方法、系统、电子终端、及存储介质
CN110910199A (zh) * 2019-10-16 2020-03-24 中国平安人寿保险股份有限公司 项目信息的排序方法、装置、计算机设备及存储介质
CN111026915A (zh) * 2019-11-25 2020-04-17 Oppo广东移动通信有限公司 视频分类方法、视频分类装置、存储介质与电子设备

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465598A (zh) * 2020-12-04 2021-03-09 中国移动通信集团黑龙江有限公司 一种用户画像生成方法、装置、设备及计算机存储介质
CN112528632A (zh) * 2020-12-07 2021-03-19 用友网络科技股份有限公司 基于交易数据的企业用户画像的标签确定方法和装置
CN113010727A (zh) * 2021-03-22 2021-06-22 平安科技(深圳)有限公司 直播平台画像的构建方法、装置、设备及存储介质
CN113010727B (zh) * 2021-03-22 2024-02-02 平安科技(深圳)有限公司 直播平台画像的构建方法、装置、设备及存储介质
CN113129096A (zh) * 2021-03-26 2021-07-16 南京石匠网络科技有限公司 一种基于拼中概率的高效成团方法及其系统
CN113706236A (zh) * 2021-06-02 2021-11-26 联想(北京)有限公司 一种推荐方法、装置及电子设备
CN113407826A (zh) * 2021-06-09 2021-09-17 广州三七极创网络科技有限公司 虚拟商品推荐方法、装置、设备和存储介质
CN113407827A (zh) * 2021-06-11 2021-09-17 广州三七极创网络科技有限公司 基于用户价值分类的信息推荐方法、装置、设备及介质
CN114372821A (zh) * 2021-12-31 2022-04-19 金地(集团)股份有限公司 地产销售中的用户行为数据处理方法和系统、介质
CN114648392A (zh) * 2022-05-19 2022-06-21 湖南华菱电子商务有限公司 基于用户画像的产品推荐方法、装置、电子设备及介质
CN114648392B (zh) * 2022-05-19 2022-07-29 湖南华菱电子商务有限公司 基于用户画像的产品推荐方法、装置、电子设备及介质
CN114997957A (zh) * 2022-06-14 2022-09-02 中国银行股份有限公司 基于用户画像的消费推荐方法、装置、设备及存储介质
CN117593034A (zh) * 2024-01-17 2024-02-23 湖南三湘银行股份有限公司 基于计算机的用户分类方法
CN117593034B (zh) * 2024-01-17 2024-06-07 湖南三湘银行股份有限公司 基于计算机的用户分类方法

Similar Documents

Publication Publication Date Title
CN112001754A (zh) 用户画像生成方法、装置、设备及计算机可读介质
CN108665329B (zh) 一种基于用户浏览行为的商品推荐方法
Aakash et al. Assessment of hotel performance and guest satisfaction through eWOM: big data for better insights
Sismeiro et al. Modeling purchase behavior at an e-commerce web site: A task-completion approach
CN111080398B (zh) 商品推荐方法、装置、计算机设备和存储介质
Luo et al. Recovering hidden buyer–seller relationship states to measure the return on marketing investment in business-to-business markets
CN107220852A (zh) 用于确定目标推荐用户的方法、装置和服务器
CN111626832B (zh) 产品推荐方法、装置及计算机设备
CN112365283B (zh) 一种优惠券发放方法、装置、终端设备及存储介质
CN112418932B (zh) 一种基于用户标签的营销信息推送方法及装置
Fu et al. Fused latent models for assessing product return propensity in online commerce
CN106611344A (zh) 挖掘潜在客户的方法及装置
CN111400613A (zh) 物品推荐方法、装置、介质及计算机设备
CN112925973B (zh) 数据处理方法和装置
Agyapong Exploring the influential factors of online purchase intention in Finland
JP6101620B2 (ja) 購買予測装置、方法、及びプログラム
Zheng et al. A scalable purchase intention prediction system using extreme gradient boosting machines with browsing content entropy
Mykhalchuk et al. Development of recommendation system in e-commerce using emotional analysis and machine learning methods
CN111680213B (zh) 信息推荐方法、数据处理方法及装置
CN106919609B (zh) 产品信息推送方法和装置
CN114185954A (zh) 会员管理方法、会员管理平台、会员管理系统和存储介质
TRAN et al. The Influence of Brand Equity on Customer Purchase Decision: A Case Study of Retailers Distribution
US20170068962A1 (en) Forecasting customer channel choice using cross-channel loyalty
CN113077292B (zh) 一种用户分类方法、装置、存储介质及电子设备
Wünderlich et al. A seasonal model with dropout to improve forecasts of purchase levels

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20231124

Address after: Unit 5B03, 5th Floor, Building 2, No. 277 Longlan Road, Xuhui District, Shanghai, 200000

Applicant after: SHANGHAI SECOND PICKET NETWORK TECHNOLOGY CO.,LTD.

Address before: Unit 5B04, 5th Floor, Building 2, No. 277 Longlan Road, Xuhui District, Shanghai, 200332

Applicant before: Shanghai Fengzhi Technology Co.,Ltd.

TA01 Transfer of patent application right