CN111984839A - 绘制用户画像的方法和装置 - Google Patents

绘制用户画像的方法和装置 Download PDF

Info

Publication number
CN111984839A
CN111984839A CN201910425163.7A CN201910425163A CN111984839A CN 111984839 A CN111984839 A CN 111984839A CN 201910425163 A CN201910425163 A CN 201910425163A CN 111984839 A CN111984839 A CN 111984839A
Authority
CN
China
Prior art keywords
interface
data
target object
score
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910425163.7A
Other languages
English (en)
Inventor
党俊峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Wodong Tianjun Information Technology Co Ltd
Priority to CN201910425163.7A priority Critical patent/CN111984839A/zh
Publication of CN111984839A publication Critical patent/CN111984839A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种绘制用户画像的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取界面停留数据、界面光标数据或界面点击数据;基于界面停留数据、界面光标数据或界面点击数据确定目标对象以及目标对象的停留时长;根据停留时长计算目标对象的对象特征的特征得分;根据特征得分从对象特征中选取最佳特征值,并基于最佳特征值绘制用户画像。该实施方式在缺少关键数据的情况下,依然能够提取出绘制用户画像的数据,精准地绘制用户画像。

Description

绘制用户画像的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种绘制用户画像的方法和装置。
背景技术
随着计算机技术的迅猛发展,各种媒体、学习以及生活服务等网络平台也在不断发展,并已融入人们的生活。
为更好地帮助用户准确、高效地从网络获取信息,需要基于相关数据对用户进行分析,以得出用户画像,从而使用户能够获取到符合其偏好或满足其诉求的信息。目前,用户画像主要通过以下方法得出:
1、基于用户的收藏或订购等数据分析用户的诉求或偏好,以得出用户画像;
2、基于用户的点击或查看等数据分析用户的诉求或偏好,以得出用户画像。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
具有局限性,若缺少收藏、订购、点击和查看等关键数据,则无法绘制用户画像。
发明内容
有鉴于此,本发明实施例提供一种绘制用户画像的方法和装置,在缺少关键数据时,仍能够准确提取出绘制用户画像的数据。
为实现上述目的,根据本发明实施例的一个方面,提供了一种绘制用户画像的方法。
本发明实施例的一种绘制用户画像的方法包括:获取界面停留数据、界面光标数据或界面点击数据;基于所述界面停留数据、所述界面光标数据或所述界面点击数据确定目标对象以及所述目标对象的停留时长;根据所述目标对象的停留时长计算所述目标对象的对象特征的特征得分;根据所述特征得分从所述对象特征中选取最佳特征值,并基于所述最佳特征值绘制用户画像。
可选地,获取界面停留数据、界面光标数据或界面点击数据包括:监听用户对界面的操作指令;其中,所述操作指令包括滑动界面指令、移动光标指令或点击指令;根据所述滑动界面指令获取界面停留数据;根据所述移动光标指令获取界面光标数据;根据所述点击指令获取界面点击数据。
可选地,所述目标对象包括非查看对象和查看对象;以及基于所述界面停留数据、所述界面光标数据或所述界面点击数据确定目标对象以及所述目标对象的停留时长包括:基于所述界面停留数据或所述界面光标数据确定所述非查看对象以及所述非查看对象的停留时长;基于所述界面点击数据确定所述查看对象,并选取最高停留时长作为所述查看对象的停留时长。
可选地,所述目标对象还包括历史对象;以及根据所述目标对象的停留时长计算所述目标对象的对象特征的特征得分之前还包括:从历史行为数据中提取与所述非查看对象或所述查看对象的类型相同的所述历史对象,并选取最高停留时长作为所述历史对象的停留时长。
可选地,所述对象特征包括离散型特征和连续型特征;以及根据所述目标对象的停留时长计算所述目标对象的对象特征的特征得分包括:
根据所述目标对象的停留时长计算所述目标对象的离散型特征得分;其中,所述离散型特征得分采用以下公式计算:
Figure BDA0002067260300000031
其中,P为离散型特征得分,N为离散个数,M1为离散型特征对应的停留时长,T为所有所述目标对象的停留时长总和;
根据所述目标对象的停留时长计算所述目标对象的连续型特征得分;其中,所述连续型特征得分采用以下公式计算:
Figure BDA0002067260300000032
其中,C为连续型特征得分,S为连续型特征的值,M2为连续型特征对应的停留时长,T为所有所述目标对象的停留时长总和。
可选地,根据所述特征得分从所述对象特征中选取最佳特征包括:选取所述离散型特征得分最高的所述离散型特征的值作为最佳特征值;以及选取所述连续型特征得分最接近期望平均值的所述连续型特征的值作为所述最佳特征值。
可选地,所述方法还包括:根据所述目标对象具有的所述最佳特征值的数量确定所述目标对象的关注得分。
为实现上述目的,根据本发明实施例的另一方面,提供了一种绘制用户画像的装置。
本发明实施例的一种绘制用户画像的装置包括:获取模块,用于获取界面停留数据、界面光标数据或界面点击数据;确定模块,用于基于所述界面停留数据、所述界面光标数据或所述界面点击数据确定目标对象以及所述目标对象的停留时长;计算模块,用于根据所述目标对象的停留时长计算所述目标对象的对象特征的特征得分;选取模块,用于根据所述特征得分从所述对象特征中选取最佳特征值,并基于所述最佳特征值绘制用户画像。
可选地,所述获取模块还用于:监听用户对界面的操作指令;其中,所述操作指令包括滑动界面指令、移动光标指令或点击指令;根据所述滑动界面指令获取界面停留数据;根据所述移动光标指令获取界面光标数据;根据所述点击指令获取界面点击数据。
可选地,所述目标对象包括非查看对象和查看对象;以及所述确定模块还用于:基于所述界面停留数据或所述界面光标数据确定所述非查看对象以及所述非查看对象的停留时长;基于所述界面点击数据确定所述查看对象,并选取最高停留时长作为所述查看对象的停留时长。
可选地,所述目标对象还包括历史对象;以及所述确定模块还用于:从历史行为数据中提取与所述非查看对象或所述查看对象的类型相同的所述历史对象,并选取最高停留时长作为所述历史对象的停留时长。
可选地,所述对象特征包括离散型特征和连续型特征;以及所述计算模块还用于:
根据所述目标对象的停留时长计算所述目标对象的离散型特征得分;其中,所述离散型特征得分采用以下公式计算:
Figure BDA0002067260300000041
其中,P为离散型特征得分,N为离散个数,M1为离散型特征对应的停留时长,T为所有所述目标对象的停留时长总和;
根据所述目标对象的停留时长计算所述目标对象的连续型特征得分;其中,所述连续型特征得分采用以下公式计算:
Figure BDA0002067260300000042
其中,C为连续型特征得分,S为连续型特征的值,M2为连续型特征对应的停留时长,T为所有所述目标对象的停留时长总和;
所述选取模块还用于:
选取所述离散型特征得分最高的所述离散型特征的值作为最佳特征值;
选取所述连续型特征得分最接近期望平均值的所述连续型特征的值作为所述最佳特征值。
可选地,所述装置还包括分析模块,用于:
根据所述目标对象具有的所述最佳特征值的数量确定所述目标对象的关注得分。
为实现上述目的,根据本发明实施例的又一方面,提供了一种绘制用户画像的电子设备。
本发明实施例的一种绘制用户画像的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种绘制用户画像的方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读存储介质。
本发明实施例的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种绘制用户画像的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为采用根据用户对界面的操作指令获取界面停留数据、界面光标数据或界面点击数据;基于界面停留数据、界面光标数据或界面点击数据确定目标对象以及目标对象的停留时长;根据停留时长计算目标对象的对象特征的特征得分;根据特征得分从对象特征中选取最佳特征值,并基于最佳特征值绘制用户画像的技术手段,所以克服了若缺少收藏、订购、点击和查看等关键数据,则无法绘制用户画像的技术问题,进而达到在缺少关键数据的情况下,依然能够提取出绘制用户画像的数据,精准地绘制用户画像的技术效果。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的绘制用户画像的方法的主要步骤的示意图;
图2是根据本发明一个可参考实施例的绘制用户画像的方法的主要流程的示意图;
图3是根据本发明另一个可参考实施例的绘制用户画像的方法的主要流程的示意图;
图4是根据本发明实施例的绘制用户画像的装置的主要模块的示意图;
图5是本发明实施例可以应用于其中的示例性系统架构图;
图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要指出的是,在不冲突的情况下,本发明的实施例以及实施例中的技术特征可以相互结合。
在大数据时代,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,即绘制用户画像,能够帮助用户准确、高效地从网络获取信息,例如某个用户更偏好哪类对象或更关注哪些领域等。现有的绘制用户画像的方法,需要基于用户的收藏、订购、点击和查看等关键数据进行分析,对于新用户等群体则不存在这些关键数据,无法绘制用户画像,且对于已订购或查看等数据对应的对象,用户可能不需要或不再关注了,而仅通过用户收藏或点击等数据进行分析,对应的对象的数量有限,缺少对象比对,不能精准地确定用户为何在多个对象中选择了该对象,具有局限性,此外基于该分析结果推荐的对象多为相似类型的,较为单一,用户体验较差。
为此,本发明实施例提出一种绘制用户画像的方法和装置,能够基于用户的点击、收藏、查看或页面驻留等操作行为,并结合用户的驻留时间,在缺少关键数据的情况下,依然能够提取出绘制用户画像的数据,精准地绘制用户画像,从而对用户偏好进行分析,进而提高用户体验。
图1是根据本发明实施例的绘制用户画像的方法的主要步骤的示意图。
如图1所示,本发明实施例的绘制用户画像的方法主要包括以下步骤:
步骤S101:获取界面停留数据、界面光标数据或界面点击数据。
操作指令可以包括滑动界面指令、移动光标指令或点击指令,其中,滑动界面指令可以代表用户的翻阅行为,移动光标指令可以代表用户的浏览行为,点击指令可以代表用户的点击行为。对于手机或平板等移动终端,操作指令可能仅是滑动界面指令或点击指令。对于电脑等个人终端,操作指令可能是滑动界面指令、移动光标指令或点击指令。
本发明实施例在绘制用户画像时,不再仅依赖于历史数据,还可以对用户的实时操作行为进行分析,以准确绘制用户画像。需要说明的是,本发明实施例中的对象可以是文字、图片或产品等。
在本发明实施例中,步骤S101可以通过以下方式实现:监听用户对界面的操作指令;根据滑动界面指令获取界面停留数据;根据移动光标指令获取界面光标数据;根据点击指令获取界面点击数据。
在用户浏览界面时,可以监听用户对界面的操作指令,以便根据用户的细节行为得到可能满足用户诉求或符合用户偏好的目标对象。
具体地,可以根据用户的操作指令来获取停留界面对应的数据、光标停留区域对应的数据或点击处对应的数据等类型的界面数据。例如,如果用户两次滑动界面之间存在驻留、用户将光标停留某处或用户点击了界面的某处,则获取对应的界面数据。
步骤S102:基于界面停留数据、界面光标数据或界面点击数据确定目标对象以及目标对象的停留时长。
在得到界面数据之后,可以基于界面数据推测出可能满足用户诉求或符合用户偏好的目标对象,并确定目标对象的停留时长,该停留时长可以表示用户为该目标对象而驻留的时间。
在本发明实施例中,目标对象可以包括非查看对象和查看对象。界面停留数据为:因用户两次滑动界面之间存在驻留而获取的数据,其对应非查看对象;界面光标数据为:因用户将光标停留某处而获取的数据,其对应非查看对象;界面点击数据为:因用户点击了界面的某处而获取的数据,其对应查看对象。
具体地,上述步骤S102可以通过以下方式实现:基于界面停留数据和界面光标数据确定非查看对象以及非查看对象的停留时长;基于界面点击数据确定查看对象,并选取最高停留时长作为查看对象的停留时长。
需要说明的是,在选取非查看对象时,可以选取停留时长最高的预设数量的对象作为非查看对象,也可以选取停留时长超过预设时长的对象作为非查看对象等,例如选取5个停留时长最高的对象或停留时长超过5秒的对象。查看对象的停留时长可以设置为最高停留时长,该最高停留时长可以是非查看对象的停留时长中的最高值,也可以是根据实际需要或历史经验而预设的时长。此外,在基于界面停留数据确定非查看对象时,可以选取位于驻留界面中心点、中部或上部等预设位置的对象为非查看对象。
此外,目标对象还可以包括历史对象。本发明实施例的绘制用户画像的方法还可以包括:从历史行为数据中提取与非查看对象或查看对象的类型相同的历史对象,并选取最高停留时长作为历史对象的停留时长。
为丰富目标对象的组成,还可以从历史行为数据中提取与非查看对象或查看对象的类型相同的历史对象,作为目标对象。历史行为数据是指用户的历史收藏行为或历史加购物车等行为数据。需要说明的是,历史对象的停留时长可以设置为最高停留时长,该最高停留时长可以是非查看对象的停留时长中的最高值,也可以是根据实际需要或历史经验而预设的时长。
步骤S103:根据目标对象的停留时长计算目标对象的对象特征的特征得分。
在得到可能满足用户诉求或符合用户偏好的目标对象后,可以对目标对象进行特征分析,以确定用户可能关注的特征。对于用户对对象特征的关注程度,可以进行量化,即计算对象特征的特征得分,特征得分可以为用户的用户画像提供数据支持,提高用户体验。
在本发明实施例中,对象特征可以包括离散型特征和连续型特征。其中,离散型特征是指所有取值能够一一列举出来的特征,例如领域、款式、性能或颜色等。连续型特征是指取值是区间中的任意一点的特征,例如评论数或关注人数等。相应地,特征得分包括离散型特征得分和连续型特征得分。
上述步骤S103可以通过以下方式实现:根据目标对象的停留时长计算目标对象的离散型特征得分;根据目标对象的停留时长计算目标对象的连续型特征得分。
其中,离散型特征得分采用以下公式计算:
Figure BDA0002067260300000101
其中,P为离散型特征得分,N为离散个数,M1为离散型特征对应的停留时长,T为所有目标对象的停留时长总和;连续型特征得分采用以下公式计算:
Figure BDA0002067260300000102
其中,C为连续型特征得分,S为连续型特征的值,M2为连续型特征对应的停留时长,T为所有目标对象的停留时长总和。
需要说明的是,离散个数是指所有目标对象中,该离散型特征相同的目标对象数量,例如所有目标对象中具有相同品牌的目标对象数量。
步骤S104:根据特征得分从对象特征中选取最佳特征值,并基于最佳特征值绘制用户画像。
由于特征得分体现了用户对目标对象的对象特征的关注程度,因此可以选取关注程度较高的对象特征的值作为最佳特征值,以最佳特征值为基础可以绘制出用户画像,从而在缺少关键数据的情况下依然能够提取到用于绘制用户画像的数据。
上述步骤S104可以通过以下方式实现:选取离散型特征得分最高的离散型特征的值作为最佳特征值;以及选取连续型特征得分最接近期望平均值的连续型特征的值作为最佳特征值。
需要说明的是,对于连续型特征得分,如果某个目标对象的连续型特征得分与所有目标对象的连续型特征得分的期望平均值差值最小(即最接近期望平均值),则该连续型特征得分对应的连续型特征的值可以作为该目标对象的最佳特征值。离散型特征得分和连续型特征得分均基于停留时长计算得到的,能够体现用户对对象特征的关注程度,具体地,离散型特征得分越高用户的关注程度越高,连续型特征得分越接近期望平均值用户的关注程度越高。
在本发明实施例中,绘制用户画像的方法还可以包括:根据目标对象具有的最佳特征值的数量确定目标对象的关注得分。
本发明实施例的绘制用户画像的方法,还可以将用户对目标对象的偏好程度进行量化,即在确定目标对象以及目标对象的停留时长之后,计算目标对象的关注得分,关注得分体现了目标对象具备多少个用户偏好的对象特征,从而体现出用户对目标对象的偏好程度,关注得分越高,用户对目标对象的偏好程度越高。
目标对象的关注得分除了可以帮助用户准确、高效地获取信息,还可以对用户的用户画像进行验证,即验证关注得分较高的目标对象所具有的对象特征是否与用户画像相符,从而提高所绘制用户画像的精准性,进而提高用户体验。
根据本发明实施例的绘制用户画像的方法可以看出,因为采用根据用户对界面的操作指令获取界面停留数据、界面光标数据或界面点击数据;基于界面停留数据、界面光标数据或界面点击数据确定目标对象以及目标对象的停留时长;根据停留时长计算目标对象的对象特征的特征得分;根据特征得分从对象特征中选取最佳特征值,并基于最佳特征值绘制用户画像的技术手段,所以克服了若缺少收藏、订购、点击和查看等关键数据,则无法绘制用户画像的技术问题,进而达到在缺少关键数据的情况下,依然能够提取出绘制用户画像的数据,精准地绘制用户画像的技术效果。
图2是根据本发明一个可参考实施例的绘制用户画像的方法的主要流程的示意图。
如图2所示,本发明实施例的绘制用户画像的方法可以参考以下流程实施:
步骤S201:监听用户对界面的操作指令:
操作指令可以包括滑动界面指令、移动光标指令或点击指令;
步骤S202:获取滑动界面指令、移动光标指令或点击指令对应的界面停留数据、界面光标数据或界面点击数据;
步骤S203:基于界面停留数据和界面光标数据确定非查看对象以及非查看对象的停留时长;
步骤S204:基于界面点击数据确定查看对象,并选取最高停留时长作为查看对象的停留时长;
步骤S205:从历史行为数据中提取与非查看对象或查看对象的类型相同的历史对象,并选取最高停留时长作为历史对象的停留时长;
步骤S206:根据目标对象的停留时长计算目标对象的离散型特征得分和连续型特征得分;
步骤S207:选取离散型特征得分最高的离散型特征的值、以及连续型特征得分最接近期望平均值的连续型特征的值作为最佳特征值;
步骤S208:基于最佳特征值绘制用户画像;
步骤S209:根据目标对象具有的最佳特征值的数量确定目标对象的关注得分:
利用该关注得分可以对用户画像进行验证,即验证关注得分较高的目标对象所具有的对象特征是否与用户画像相符。
图3是根据本发明另一个可参考实施例的绘制用户画像的方法的主要流程的示意图。
如图3所示,本发明实施例的绘制用户画像的方法还可以参考以下流程实施:
步骤S301:监听用户每次滑动滚动条的时间和滑动位置:
滑动界面指令可以通过用户滑动滚动条来体现,通过用户每次滑动滚动条的时间的滑动位置,可以感知到用户是否滑动了界面以及用户是否驻留;
步骤S302:获取滑动位置对应对象的对象信息:
滑动位置对应对象即非查看对象,是用户可能偏好的目标对象,对象信息是目标对象的停留时长和对象特征;
步骤S303:将步骤S302获取的对象信息上报数据库;
步骤S304:特征分析:
在进行特征分析时,从数据库获取选取停留时长最高的预设数量的非查看对象或停留时长超过预设时长的非查看对象作为目标对象,并获取非查看对象的对象信息,同时,再将查看对象和历史对象作为目标对象。非查看对象的停留时长为其实际的停留时长,查看对象和历史对象的停留时长为选取的最高停留时长,并根据停留时长计算目标对象的对象特征的特征得分,此计算过程与步骤S103相同,此处不予赘述;
步骤S305:提取用于绘制用户画像的数据:
根据特征得分从对象特征中提取最佳特征值,步骤S305与步骤S104的实现方式相同,此处不予赘述。
需要说明的是,步骤S303的将对象信息上报数据库的过程,可以与步骤S304的从数据库获取对象信息的过程同步进行,即上述步骤S301-步骤S305可以与用户的正常使用同步进行。
为了进一步阐述本发明实施例的技术思想,现结合具体的应用场景,对本发明的技术方案进行说明。
假设在分析某个用户的偏好时,有5个非查看对象(分别是产品1、产品2、产品3、产品4和产品5)、2个查看对象(分别是点击产品1和点击产品2)以及2个历史对象(分别是收藏产品1和收藏产品2),并选择品牌、款式和颜色作为离散型特征,选择评论数和价格作为连续型特征,这9个产品及其停留时长和对象特征如表1所示。
表1
停留时长 品牌 款式 颜色 评论数 价格
产品1 1.5 A 4.5 200 3500
产品2 2 B 5 300 4500
产品3 1.7 A 5.5 500 2500
产品4 2.3 C 5.5 200 3500
产品5 2.5 C 5.5 300 3500
点击产品1 2.5 C 5.5 300 2500
点击产品2 2.5 A 5.5 500 2500
收藏产品1 2.5 C 5.5 300 3500
收藏产品2 2.5 A 5.5 500 2500
分别对每个对象特征做加权计算,停留时长作为权重,得到每个产品的特征得分(即品牌分、款式分、颜色分、评论分和价格分),并选取最佳特征值,且每个产品具有最佳特征值的数量为其关注得分。其中,
取离散型特征得分最高的离散型特征的值作为最佳特征值,离散型特征得分采用以下公式计算:
Figure BDA0002067260300000141
其中,P为离散型特征得分;N为离散个数;M1为离散型特征对应的停留时长,T为所有目标对象的停留时长总和;
取连续型特征得分最接近期望平均值的连续型特征的值作为最佳特征值,连续型特征得分采用以下公式计算:
Figure BDA0002067260300000142
其中,C为连续型特征得分,S为连续型特征的值,M2为连续型特征对应的停留时长,T为所有目标对象的停留时长总和。
以点击产品1为例:
T=1.5+2+1.7+2.3+2.5+2.5+2.5+2.5+2.5=20;
品牌C在9个产品中有4个,4个产品对应的停留时长M1为2.3+2.5+2.5+2.5=9.8,则点击产品1的品牌分为9.8/20=0.49;此外,品牌C对应的其他产品的品牌分也是0.49;
同样的,点击产品1的款式分为(1.7+2.3+2.5+2.5+2.5+2.5+2.5)/20=16.5/20=0.825;
同样的,点击产品1的颜色分为(2+1.7+2.3+2.5+2.5+2.5+2.5+2.5)/20=18.5/20=0.925;
对于点击产品1的评论分,用户期望评论平均值为(1.5*200+2*300+1.7*500+2.3*200+2.5*300+2.5*300+2.5*500+2.5*300+2.5*500)/20=348,300-348=-48,则点击产品1的评论分取48;
对于点击产品1的价格分,用户期望价格平均值为(1.5*3500+2*4500+1.7*2500+2.3*3500+2.5*3500+2.5*2500+2.5*2500+2.5*3500+2.5*2500)/20=3140,点击产品1价格得分=2500-3140=-640,则点击产品1的价格分取640;
其中,品牌分、款式分和颜色分在9个产品中是最高得分,评论分离得分最近,因此,品牌分、款式分、颜色分和评论分对应的值为最佳特征值,且点击产品1的关注得分为4。
采用以上方式计算其它8个产品的品牌分、款式分、颜色分、评论分和价格分。这9个产品的品牌分、款式分、颜色分、评论分、价格分和关注得分如表2所示,其中采用底色标记的是最佳特征值。
表2
Figure BDA0002067260300000151
Figure BDA0002067260300000161
通过上述步骤所提取到的最佳特征值分别是:品牌“C”、款式“5.5”、颜色“黑”、评论数“300”和价格“3500”,以上数据即为用于绘制用户画像的数据。
此外,在绘制用户画像后,还可以将关注得分较高的目标对象所具有的对象特征与用户画像进行比较,以对用户画像进行验证。
图4是根据本发明实施例的绘制用户画像的装置的主要模块的示意图。
如图4所示,本发明实施例的绘制用户画像的装置400包括:获取模块401、确定模块402、计算模块403和选取模块404。
其中,
获取模块401,用于根据用户对界面的操作指令获取界面停留数据、界面光标数据或界面点击数据;
确定模块402,用于基于所述界面停留数据、所述界面光标数据或所述界面点击数据确定目标对象以及所述目标对象的停留时长;
计算模块403,用于根据所述目标对象的停留时长计算所述目标对象的对象特征的特征得分;
选取模块404,用于根据所述特征得分从所述对象特征中选取最佳特征值,并基于所述最佳特征值绘制用户画像。
在本发明实施例中,所述获取模块401还用于:监听用户对界面的操作指令;其中,所述操作指令包括滑动界面指令、移动光标指令或点击指令;根据所述滑动界面指令获取界面停留数据;根据所述移动光标指令获取界面光标数据;根据所述点击指令获取界面点击数据。
在本发明实施例中,所述目标对象可以包括非查看对象和查看对象。
所述确定模块402还可以用于:基于所述界面停留数据或所述界面光标数据确定所述非查看对象以及所述非查看对象的停留时长;基于所述界面点击数据确定所述查看对象,并选取最高停留时长作为所述查看对象的停留时长。
在本发明实施例中,所述目标对象还可以包括历史对象。
所述确定模块402还可以用于:从历史行为数据中提取与所述非查看对象或所述查看对象的类型相同的所述历史对象,并选取最高停留时长作为所述历史对象的停留时长。
在本发明实施例中,所述对象特征可以包括离散型特征和连续型特征。
所述计算模块403还可以用于:根据所述目标对象的停留时长计算所述目标对象的离散型特征得分;其中,所述离散型特征得分采用以下公式计算:
Figure BDA0002067260300000171
其中,P为离散型特征得分,N为离散个数,M1为离散型特征对应的停留时长,T为所有所述目标对象的停留时长总和;
根据所述目标对象的停留时长计算所述目标对象的连续型特征得分;其中,所述连续型特征得分采用以下公式计算:
Figure BDA0002067260300000172
其中,C为连续型特征得分,S为连续型特征的值,M2为连续型特征对应的停留时长,T为所有所述目标对象的停留时长总和。
所述选取模块404还可以用于:
选取所述离散型特征得分最高的所述离散型特征的值作为最佳特征值;
选取所述连续型特征得分最接近期望平均值的所述连续型特征的值作为所述最佳特征值。
此外,所述绘制用户画像的装置400还可以包括分析模块(图中并未示出),用于:
根据所述目标对象具有的所述最佳特征值的数量确定所述目标对象的关注得分。
根据本发明实施例的绘制用户画像的装置可以看出,因为采用根据用户对界面的操作指令获取界面停留数据、界面光标数据或界面点击数据;基于界面停留数据、界面光标数据或界面点击数据确定目标对象以及目标对象的停留时长;根据停留时长计算目标对象的对象特征的特征得分;根据特征得分从对象特征中选取最佳特征值,并基于最佳特征值绘制用户画像的技术手段,所以克服了若缺少收藏、订购、点击和查看等关键数据,则无法绘制用户画像的技术问题,进而达到在缺少关键数据的情况下,依然能够提取出绘制用户画像的数据,精准地绘制用户画像的技术效果。
图5示出了可以应用本发明实施例的绘制用户画像的方法或绘制用户画像的装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息)反馈给终端设备。
需要说明的是,本发明实施例所提供的绘制用户画像的方法一般由服务器505执行,相应地,绘制用户画像的装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、确定模块、计算和模块选取模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,计算模块还可以被描述为“根据所述目标对象的停留时长计算所述目标对象的对象特征的特征得分的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:步骤S101:获取界面停留数据、界面光标数据或界面点击数据;步骤S102:基于界面停留数据、界面光标数据或界面点击数据确定目标对象以及目标对象的停留时长;步骤S103:根据目标对象的停留时长计算目标对象的对象特征的特征得分;步骤S104:根据特征得分从对象特征中选取最佳特征值,并基于最佳特征值绘制用户画像。
根据本发明实施例的技术方案,因为采用根据用户对界面的操作指令获取界面停留数据、界面光标数据或界面点击数据;基于界面停留数据、界面光标数据或界面点击数据确定目标对象以及目标对象的停留时长;根据停留时长计算目标对象的对象特征的特征得分;根据特征得分从对象特征中选取最佳特征值,并基于最佳特征值绘制用户画像的技术手段,所以克服了若缺少收藏、订购、点击和查看等关键数据,则无法绘制用户画像的技术问题,进而达到在缺少关键数据的情况下,依然能够提取出绘制用户画像的数据,精准地绘制用户画像的技术效果。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种绘制用户画像的方法,其特征在于,包括:
获取界面停留数据、界面光标数据或界面点击数据;
基于所述界面停留数据、所述界面光标数据或所述界面点击数据确定目标对象以及所述目标对象的停留时长;
根据所述目标对象的停留时长计算所述目标对象的对象特征的特征得分;
根据所述特征得分从所述对象特征中选取最佳特征值,并基于所述最佳特征值绘制用户画像。
2.根据权利要求1所述的方法,其特征在于,获取界面停留数据、界面光标数据或界面点击数据包括:
监听用户对界面的操作指令;其中,所述操作指令包括滑动界面指令、移动光标指令或点击指令;
根据所述滑动界面指令获取界面停留数据;
根据所述移动光标指令获取界面光标数据;
根据所述点击指令获取界面点击数据。
3.根据权利要求1所述的方法,其特征在于,所述目标对象包括非查看对象和查看对象;以及
基于所述界面停留数据、所述界面光标数据或所述界面点击数据确定目标对象以及所述目标对象的停留时长包括:
基于所述界面停留数据或所述界面光标数据确定所述非查看对象以及所述非查看对象的停留时长;
基于所述界面点击数据确定所述查看对象,并选取最高停留时长作为所述查看对象的停留时长。
4.根据权利要求3所述的方法,其特征在于,所述目标对象还包括历史对象;以及
根据所述目标对象的停留时长计算所述目标对象的对象特征的特征得分之前还包括:
从历史行为数据中提取与所述非查看对象或所述查看对象的类型相同的所述历史对象,并选取最高停留时长作为所述历史对象的停留时长。
5.根据权利要求1所述的方法,其特征在于,所述对象特征包括离散型特征和连续型特征;以及
根据所述目标对象的停留时长计算所述目标对象的对象特征的特征得分包括:
根据所述目标对象的停留时长计算所述目标对象的离散型特征得分;其中,所述离散型特征得分采用以下公式计算:
Figure FDA0002067260290000021
其中,P为离散型特征得分,N为离散个数,M1为离散型特征对应的停留时长,T为所有所述目标对象的停留时长总和;
根据所述目标对象的停留时长计算所述目标对象的连续型特征得分;其中,所述连续型特征得分采用以下公式计算:
Figure FDA0002067260290000022
其中,C为连续型特征得分,S为连续型特征的值,M2为连续型特征对应的停留时长,T为所有所述目标对象的停留时长总和。
6.根据权利要求5所述的方法,其特征在于,根据所述特征得分从所述对象特征中选取最佳特征值包括:
选取所述离散型特征得分最高的所述离散型特征的值作为最佳特征值;以及
选取所述连续型特征得分最接近期望平均值的所述连续型特征的值作为所述最佳特征值。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述目标对象具有的所述最佳特征值的数量确定所述目标对象的关注得分。
8.一种绘制用户画像的装置,其特征在于,包括:
获取模块,用于获取界面停留数据、界面光标数据或界面点击数据;
确定模块,用于基于所述界面停留数据、所述界面光标数据或所述界面点击数据确定目标对象以及所述目标对象的停留时长;
计算模块,用于根据所述目标对象的停留时长计算所述目标对象的对象特征的特征得分;
选取模块,用于根据所述特征得分从所述对象特征中选取最佳特征值,并基于所述最佳特征值绘制用户画像。
9.一种绘制用户画像的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201910425163.7A 2019-05-21 2019-05-21 绘制用户画像的方法和装置 Pending CN111984839A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910425163.7A CN111984839A (zh) 2019-05-21 2019-05-21 绘制用户画像的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910425163.7A CN111984839A (zh) 2019-05-21 2019-05-21 绘制用户画像的方法和装置

Publications (1)

Publication Number Publication Date
CN111984839A true CN111984839A (zh) 2020-11-24

Family

ID=73437017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910425163.7A Pending CN111984839A (zh) 2019-05-21 2019-05-21 绘制用户画像的方法和装置

Country Status (1)

Country Link
CN (1) CN111984839A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114863580A (zh) * 2022-05-12 2022-08-05 江苏中烟工业有限责任公司 一种确定烟草加工的停留时长的方法、装置、设备及介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130151539A1 (en) * 2011-12-07 2013-06-13 Yanxin Shi Real-Time Online-Learning Object Recommendation Engine
US20130268193A1 (en) * 2012-04-10 2013-10-10 International Business Machines Corporation Personalized route generation
US20140143233A1 (en) * 2012-11-20 2014-05-22 Alibaba Group Holding Limited Method and system for recommending target object information
CN105718541A (zh) * 2016-01-18 2016-06-29 浪潮软件集团有限公司 一种获取用户喜好信息的方法及装置
CN106060117A (zh) * 2016-05-17 2016-10-26 北京京东尚科信息技术有限公司 一种页面停留时长的计时方法和装置
CN107391760A (zh) * 2017-08-25 2017-11-24 平安科技(深圳)有限公司 用户兴趣识别方法、装置及计算机可读存储介质
CN108197132A (zh) * 2017-10-09 2018-06-22 国网陕西省电力公司 一种基于图数据库的电力资产画像构建方法及装置
CN108897734A (zh) * 2018-06-13 2018-11-27 康键信息技术(深圳)有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN109064278A (zh) * 2018-07-26 2018-12-21 北京三快在线科技有限公司 目标对象推荐方法及装置、电子设备、存储介质
CN109087162A (zh) * 2018-07-05 2018-12-25 杭州朗和科技有限公司 数据处理方法、系统、介质和计算设备
CN109753601A (zh) * 2018-11-28 2019-05-14 北京奇艺世纪科技有限公司 推荐信息点击率确定方法、装置及电子设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130151539A1 (en) * 2011-12-07 2013-06-13 Yanxin Shi Real-Time Online-Learning Object Recommendation Engine
US20130268193A1 (en) * 2012-04-10 2013-10-10 International Business Machines Corporation Personalized route generation
US20140143233A1 (en) * 2012-11-20 2014-05-22 Alibaba Group Holding Limited Method and system for recommending target object information
CN105718541A (zh) * 2016-01-18 2016-06-29 浪潮软件集团有限公司 一种获取用户喜好信息的方法及装置
CN106060117A (zh) * 2016-05-17 2016-10-26 北京京东尚科信息技术有限公司 一种页面停留时长的计时方法和装置
CN107391760A (zh) * 2017-08-25 2017-11-24 平安科技(深圳)有限公司 用户兴趣识别方法、装置及计算机可读存储介质
CN108197132A (zh) * 2017-10-09 2018-06-22 国网陕西省电力公司 一种基于图数据库的电力资产画像构建方法及装置
CN108897734A (zh) * 2018-06-13 2018-11-27 康键信息技术(深圳)有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN109087162A (zh) * 2018-07-05 2018-12-25 杭州朗和科技有限公司 数据处理方法、系统、介质和计算设备
CN109064278A (zh) * 2018-07-26 2018-12-21 北京三快在线科技有限公司 目标对象推荐方法及装置、电子设备、存储介质
CN109753601A (zh) * 2018-11-28 2019-05-14 北京奇艺世纪科技有限公司 推荐信息点击率确定方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王晓霞;刘静沙;许丹丹;: "运营商大数据用户画像实践", 电信科学, no. 05 *
陈添源;: "高校移动图书馆用户画像构建实证", 图书情报工作, no. 07 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114863580A (zh) * 2022-05-12 2022-08-05 江苏中烟工业有限责任公司 一种确定烟草加工的停留时长的方法、装置、设备及介质
CN114863580B (zh) * 2022-05-12 2023-07-07 江苏中烟工业有限责任公司 一种确定烟草加工的停留时长的方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN109145280B (zh) 信息推送的方法和装置
CN107679211B (zh) 用于推送信息的方法和装置
CN109522483B (zh) 用于推送信息的方法和装置
CN107577807B (zh) 用于推送信息的方法和装置
CN107944481B (zh) 用于生成信息的方法和装置
CN108805594B (zh) 信息推送方法和装置
CN111125574B (zh) 用于生成信息的方法和装置
CN108334568B (zh) 房源推送方法、装置、设备及计算机可读存储介质
CN107526718B (zh) 用于生成文本的方法和装置
CN109446442B (zh) 用于处理信息的方法和装置
CN106681598B (zh) 信息输入方法和装置
CN107908662B (zh) 搜索系统的实现方法和实现装置
CN110619078B (zh) 用于推送信息的方法和装置
US11244153B2 (en) Method and apparatus for processing information
CN110866040A (zh) 用户画像生成方法、装置和系统
CN113568699A (zh) 一种内容显示方法、装置、设备及存储介质
CN108512674B (zh) 用于输出信息的方法、装置和设备
CN110245357B (zh) 主实体识别方法和装置
CN109992719B (zh) 用于确定推送优先级信息的方法和装置
CN109829033B (zh) 数据展示方法和终端设备
EP3564833B1 (en) Method and device for identifying main picture in web page
CN111984839A (zh) 绘制用户画像的方法和装置
CN109472028B (zh) 用于生成信息的方法和装置
CN111782850A (zh) 一种基于手绘图的物品搜索方法和装置
CN108509442B (zh) 搜索方法和装置、服务器以及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination