CN110516151B - 有效行为检测和个性化推荐方法 - Google Patents

有效行为检测和个性化推荐方法 Download PDF

Info

Publication number
CN110516151B
CN110516151B CN201910794970.6A CN201910794970A CN110516151B CN 110516151 B CN110516151 B CN 110516151B CN 201910794970 A CN201910794970 A CN 201910794970A CN 110516151 B CN110516151 B CN 110516151B
Authority
CN
China
Prior art keywords
behavior
user
user data
effective
invalid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910794970.6A
Other languages
English (en)
Other versions
CN110516151A (zh
Inventor
罗元帅
李琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
MIGU Culture Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
MIGU Culture Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, MIGU Culture Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910794970.6A priority Critical patent/CN110516151B/zh
Publication of CN110516151A publication Critical patent/CN110516151A/zh
Application granted granted Critical
Publication of CN110516151B publication Critical patent/CN110516151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种有效行为检测和个性化推荐方法,其中有效行为检测方法包括:获取用户的用户数据;基于所述用户数据,确定所述用户的行为检测参数;所述行为检测参数包括操作行为时刻,还包括设备运行状态和/或针对有效行为测试的反应结果;基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本。本发明实施例提供的有效行为检测和个性化推荐方法,根据用户数据,确定用户的行为检测参数,进而从用户数据中选取有效行为样本和/或无效行为样本,实现了准确的有效行为检测,以便于将有效行为检测得到的有效行为应用于用户画像,从而提高用户画像的准确性,实现准确可靠的个性化推荐。

Description

有效行为检测和个性化推荐方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种有效行为检测和个性化推荐方法。
背景技术
用户画像召回是个性化推荐中的一种最主要召回方式,召回是指从大数据集中筛选出一个推荐候选集的策略,而在用户画像召回中用户画像的质量将直接影响召回的准确性。
以音乐APP(Application,手机软件)在线歌曲业务场景中歌曲推荐为例,在音乐APP中歌曲主要以歌单形式进行自动批量播放。现有技术中,音乐APP为了完成用户画像的构建,首先需要确定用户所喜爱的歌曲,而现有技术提供的音乐APP往往根据用户数据来确定用户对歌曲的喜好程度,例如:当用户完整的听完一首歌曲后,表示用户喜欢这首歌曲,而当用户在播放过程中选择了切歌,则表示该用户不喜欢这首歌曲,进而根据这种方式确定用户喜欢的歌曲,再根据用户喜欢的歌曲进行用户画像。
但上述现有技术提供的方案中,单首歌曲的总时长较短,能够在短时间内播放完成,因此难以区分用户是否进行了有效听歌行为,例如:用户离开时忘记了关闭音乐APP,但音乐APP仍在继续播放该音乐,或者用户虽然在播放音乐但其实把音量调到了最低,并没有在听歌。由于上述这些情况的存在,如继续采用现有技术中根据音乐APP是否完整播放一首歌曲来确定用户喜好歌曲,会导致创建的用户画像准确度较差,进而影响根据用户画像进行推荐的效果。
因此,如何对用户数据的有效性进行检测,从而确保用户画像的准确性,仍然是本领域技术人员亟待解决的问题。
发明内容
为了解决上述问题,本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的一种有效行为检测和个性化推荐方法。
第一方面,本发明实施例提供一种个性化推荐方法,包括:
获取用户的用户数据;
基于所述用户数据,确定所述用户的行为检测参数;所述行为检测参数包括操作行为时刻,还包括设备运行状态和/或针对有效行为测试的反应结果;
基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本。
优选地,所述基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本,具体包括:
确定所述用户数据中,所述操作行为时刻对应的位置;
从所述用户数据中选取所述操作行为时刻后的部分,作为所述有效行为样本;
或,从所述用户数据中选取两个相邻的所述操作行为时刻之间的部分,作为所述有效行为样本;
所述有效行为样本的时长小于等于有效行为时长阈值。
优选地,所述基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本,具体包括:
确定所述用户数据中,所述操作行为时刻对应的位置,以及无效行为时长阈值对应时刻的位置;
从所述用户数据中选取超出所述无效行为时长阈值,且不包含所述操作行为时刻的部分,作为所述无效行为样本。
优选地,所述基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本,具体包括:
从所述用户数据中选取所述设备运行状态满足预设无效设备运行状态条件,且不包含所述操作行为时刻的部分,作为所述无效行为样本;
其中,所述预设无效设备运行状态条件包括:
所述设备运行状态中的设备运行时段在预设无效时间段内;
所述设备运行时段在所述预设无效时间段内,所述设备运行状态中的设备类型为PC端,且所述设备运行状态中的设备外设连接状态为耳机连接;
所述设备运行状态中的设备网络状态为WiFi连接,所述设备运行状态中的设备电源状态为电池充电状态,且所述设备外设连接状态为耳机连接中的至少一种。
优选地,所述基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本,之前还包括:
基于所述用户数据,确定所述用户的初始画像;
基于所述初始画像,将所述用户分配至对应的用户组;
获取所述用户组对应的有效行为时长阈值和/或无效行为时长阈值;
其中,所述有效行为时长阈值是基于所述用户组的平均行为时长得到的;所述无效行为时长阈值基于所述用户组中的部分用户的所述反应结果得到。
优选地,还包括:
获取所述用户的实时用户数据;
将所述实时用户数据输入到行为识别模型中,得到所述行为识别模型输出的行为识别结果;其中,所述行为识别模型是基于所述有效行为样本和所述无效行为样本训练得到的。
第二方面,本发明实施例还提供一种个性化推荐方法,包括:
基于如第一方面所提供的有效行为检测方法,得到用户的实时用户数据对应的行为识别结果;
若所述行为识别结果为有效行为,则基于所述实时用户数据生成用户画像;
基于所述用户画像进行个性化推荐。
优选地,所述基于所述用户画像进行个性化推荐,具体包括:
基于所述用户画像获取第一召回内容;
基于预设召回方法获取第二召回内容;
基于所述用户画像确定所述第一召回内容和/或所述第二召回内容的权重;
基于所述第一召回内容、所述第二召回内容以及所述权重,进行个性化推荐。
第三方面,本发明实施例提供了一种有效行为检测系统,包括:
用户数据获取单元,用于获取用户的用户数据;
检测参数获取单元,用于基于所述用户数据,确定所述用户的行为检测参数;所述行为检测参数包括操作行为时刻,还包括设备运行状态和/或针对有效行为测试的反应结果;
行为检测单元,用于基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本。
第四方面,本发明实施例提供了一种个性化推荐系统,包括:
有效行为检测单元,用于基于如第一方面提供的有效行为检测方法,得到用户的实时用户数据对应的行为识别结果;
用户画像单元,用于若所述行为识别结果为有效行为,则基于所述实时用户数据生成用户画像;
个性化推荐单元,用于基于所述用户画像进行个性化推荐。
第五方面,本发明实施例提供了一种电子设备,包括:
处理器、存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述有效行为检测方法或个性化推荐方法。
第六方面,本发明实施例提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述有效行为检测方法或个性化推荐方法。
本发明实施例提供的一种有效行为检测和个性化推荐方法,根据用户数据,确定用户的行为检测参数,进而从用户数据中选取有效行为样本和/或无效行为样本,实现了准确的有效行为检测,以便于将有效行为检测得到的有效行为应用于用户画像,从而提高用户画像的准确性,实现准确可靠的个性化推荐。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种有效行为检测方法流程示意图;
图2是本发明实施例提供的一种个性化推荐方法流程示意图;
图3是本发明实施例提供的一种有效行为检测系统结构示意图;
图4为本发明实施例提供的一种个性化推荐系统结构示意图;
图5是本发明实施例提供的一种电子设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种有效行为检测方法流程示意图,如图1所示,该方法包括:
步骤110,获取用户的用户数据。
需要说明的是,本发明实施例的执行主体可以为服务端,用于对用户数据的有效性进行检测。用户数据对应的应用场景很多,例如:听歌、看视频、看小说、看新闻等场景。优选的,在本发明所有实施例中,以听歌场景作为示例进行方案说明,对此本发明实施例不再赘述。
此处,用户数据实质上是用户通过设备运行软件程序时被记录下的数据,例如:用户通过设备运行音乐APP,并通过音乐APP听歌,那么服务端会相应的记录下用户在听歌过程中所产生的用户数据,例如:播放、暂停、切歌、退出等。此外,用户数据中还可以包含上述播放、暂停、切歌、退出对应的时间,播放的曲目,播放的顺序等。
步骤120,基于用户数据,确定用户的行为检测参数;行为检测参数包括操作行为时刻,还包括设备运行状态和/或针对有效行为测试的反应结果。
其中,操作行为时刻是指用户进行交互操作的时间点,此处的交互操作可以是点击播放、暂停、切歌、发表评论、更改播放顺序等。
设备运行状态是指用户所使用的设备在运行中的状态参数,设备运行状态包括设备类型、设备运行时段、设备网络状态、设备电源状态、设备外设连接状态中的至少一种。其中,设备类型可以是PC端、移动端,也可以具体细分为台式电脑、笔记本电脑、智能手机、智能手表等。设备网络状态为设备的网络连接状态,例如有线连接、WiFi连接、3G/4G连接等。设备电源状态即设备的电源供电状态,例如笔记本电脑和智能手机的设备电源状态可以是电池充电状态或者电池供电状态。设备外设连接状态表征设备在当前时刻连接的外部设备,例如是否连接有耳机、音箱等。
例如:用户通过设备运行音乐APP时,基于用户数据确定设备运行状态中的设备类型为台式电脑,设备运行时段为12:30至13:00,设备外设连接状态为耳机连接,则此时段内音乐APP播放的音乐可能是无效播放,因为上班族可能此时在吃饭或午休。
有效行为测试是由服务端抽取部分用户,在用户通过设备运行软件程序时通过需要用户反馈操作的方式对用户当前的行为是否为有效行为进行测试,反应结果即用户是否针对有效行为测试反馈操作。例如在服务端暂停歌单播放后用户是否重新点击播放歌单,在服务端切歌后用户是否切回原曲等。通过暂停歌单播放、切歌等手段对用户当前的在听歌场景下生成的用户数据对应的实际行为是否是有效行为进行测试。
步骤130,基于行为检测参数,从用户数据中选取有效行为样本和/或无效行为样本。
具体地,有效行为样本是指用户数据中判定为有效行为的部分,无效行为样本是指用户数据中判定为无效行为的部分,即有效行为样本和无效行为样本均为用户数据中的一段时间对应的数据。此处得到的有效行为样本和/或无效行为样本可用于训练模型,从而得到能够自动进行有效行为检测的行为识别模型,实现实时的有效行为检测。此处有效行为样本即模型训练时的正样本,无效行为样本即模型训练时的负样本。此外,也可以将步骤130得到的有效行为样本和/或无效行为样本作为针对用户数据的有效行为检测结果,直接应用于用户图像,以提高用户画像的准确性。
此处,基于行为检测参数从用户数据中选取有效行为样本和/或无效行为样本的方法有多种,例如以操作行为时刻为中心,选取用户数据中预先设定的时长的部分作为有效行为样本,又例如将用户数据中超出预先设定的时长且其间不存在操作行为时刻的部分作为无效行为样本,本发明实施例对此不作具体限定。
本发明实施例提供的方法,根据用户数据,确定用户的行为检测参数,进而从用户数据中选取有效行为样本和/或无效行为样本,实现了准确的有效行为检测,以便于将有效行为检测得到的有效行为应用于用户画像,从而提高用户画像的准确性,实现准确可靠的个性化推荐。
基于上述实施例,该方法中,步骤130包括:确定用户数据中,操作行为时刻对应的位置;从用户数据中选取操作行为时刻后的部分,作为有效行为样本;其中,有效行为样本的时长小于等于有效行为时长阈值。
具体地,有效行为时长阈值为预先设定的用户执行有效行为的最小时间长度值。有效行为时长阈值可以是针对单一用户确定的,也可以是针对一类用户或者全部用户统一确定的,本发明实施例对此不作具体限定。在操作行为时刻后,例如在用户点播歌曲后,或者用户切歌后,可以选取时间长度为有效行为时长阈值的用户数据,作为有效行为样本。例如,假设有效行为时长阈值为30分钟,用户在9点10分开启音乐APP,则将9点10分至9点40分的用户数据作为有效行为样本。
基于上述任一实施例,该方法中,步骤130包括:确定用户数据中,操作行为时刻对应的位置;从用户数据中选取两个相邻的操作行为时刻之间的部分,作为有效行为样本;其中,有效行为样本的时长小于等于有效行为时长阈值。
具体地,可以将用户执行的两个有效行为之间的用户数据,作为有效行为样本。需要说明的是,由两个相邻的操作行为时刻选取得到的用户数据的时长应该小于等于有效行为时长阈值。假设有效行为时长阈值为1小时,则用户在13点14分点播歌曲,在13点32分切歌,则可以将13点14分至13点32分的用户数据作为有效行为样本,用户在15点20分更改播放顺序,在18点30分切歌,则15点20分至18点30分的用户数据不作为有效行为样本。
基于上述任一实施例,该方法中,步骤130包括:确定用户数据中,操作行为时刻对应的位置,以及无效行为时长阈值对应时刻的位置;从用户数据中选取超出无效行为时长阈值,且不包含操作行为时刻的部分,作为无效行为样本。
此处,无效行为时长阈值为预先设定的用户执行有效行为的最大时间长度值。无效行为时长阈值可以是针对单一用户确定的,也可以是针对一类用户或者全部用户统一确定的,本发明实施例对此不作具体限定。在用户数据中,将超出无效行为时长阈值,且其中不包含操作行为时刻的部分,选取作为无效行为样本,例如无效行为时长阈值为4小时,选取用户数据中超过4小时,且其中不包含操作行为时刻的用户数据,作为无效行为样本。
基于上述任一实施例,该方法中,步骤130包括:从用户数据中选取设备运行状态满足预设无效设备运行状态条件,且不包含操作行为时刻的部分,作为无效行为样本。
此处,预设无效设备运行状态条件为预先设定的无效行为对应的设备运行状态,预设无效设备运行状态条件可以是针对单一用户确定的,也可以是针对一类用户或者全部用户统一确定的,本发明实施例对此不作具体限定。
其中,预设无效设备运行状态条件包括:
设备运行状态中的设备运行时段在预设无效时间段内;
设备运行时段在所述预设无效时间段内,设备运行状态中的设备类型为PC端,且设备运行状态中的设备外设连接状态为耳机连接;
设备运行状态中的设备网络状态为WiFi连接,设备运行状态中的设备电源状态为电池充电状态,且设备外设连接状态为耳机连接中的至少一种。
例如预设无效设备运行状态条件可以是12:00-14:00时段内PC端且耳机连接,此环境条件下,上班族可能此时在吃饭或午休。又例如,预设无效设备运行状态条件可以是WiFi连接下电池充电状态且耳机连接,此环境条件下,用户可能将播放器放置充电。再例如,预设无效设备运行状态可以是01:00-05:00,此环境条件下用户可以在睡眠状态。在用户数据中选取设备运行状态满足预设无效设备运行状态条件,且其中不包含操作行为时刻的部分,作为无效行为样本。
基于上述任一实施例,该方法中,步骤130之前还包括:基于用户数据,确定用户的初始画像;基于初始画像,将用户分配至对应的用户组;获取用户组对应的有效行为时长阈值和/或无效行为时长阈值;其中,有效行为时长阈值是基于用户组的平均行为时长得到的;无效行为时长阈值基于用户组中的部分用户的反应结果得到。
具体地,本发明实施例中,在得到用户的用户数据之后,对用户进行了初始画像,此处的初始画像一般根据用户的基础信息和用户数据进行划分,以听歌场景为例,例如:用户的性别、年龄、职业等,常听音乐的类型是:古典、流行、摇滚等。然后就可以将用户的初始画像建立为喜欢流行歌曲的工作族、喜欢古典音乐的学生等。
在得到初始画像后,可以基于初始画像将用户分配至对应的用户组,并获取该用户组对应的有效行为时长阈值和/或无效行为时长阈值。此处,一个用户组内包含有多个用户。
针对任一用户组,其对应的有效行为时长阈值是基于用户组内用户的平均行为时长得到的,此处平均行为时长可以是用户组内用户在过去一段时间内的平均听歌时长,过去一段时间可以是过去一天或者过去一周等。由此得到的有效行为时长阈值可以是平均行为时长,或者平均行为时长的倍数等。
无效行为时长阈值可以通过对用户组中的部分用户进行有效行为测试,得到部分用户的反应结果,并根据该部分用户的反应结果确定。
基于上述任一实施例,该方法中,获取用户组对应的无效行为时长阈值,具体包括:获取多个候选行为时长阈值;针对用户组中的部分用户进行候选行为时长阈值对应的有效行为测试,得到候选行为时长阈值对应的反应结果;基于候选行为时长阈值对应的反应结果,从候选行为时长阈值中选取无效行为时长阈值。
具体地,针对任一用户组,可以预先设置多个候选行为时长阈值,例如候选行为时长阈值分别为平均行为时长的1倍、2倍、3倍、4倍,又例如,候选行为时长阈值可以分别是歌单循环播放1次、2次、3次、4次所用的时间。
对应的有效行为测试可以是在经过候选行为时长阈值后进行有效行为测试,判断当前时刻的用户行为是否为有效行为。有效行为测试可以是服务端暂停歌单播放,或者服务端在播放音频中加入噪声等,由此得到用户组内部分用户的反应结果,即在服务端暂停歌单播放后,用户是否重新点击播放歌单,或在播放音频中加入噪声后,用户是否切歌。
基于候选行为时长阈值对应的反应结果,即可从候选行为时长阈值中选取行为时长阈值。例如,当有效行为测试为服务端暂停歌单播放时,统计得到各个候选行为时长阈值下的反应结果为未重新点击播放歌单的比例,若前一候选行为时长阈值下的比例与后一候选行为时长阈值下的比例之差小于预先设定的差值阈值,即前一候选行为时长阈值下的比例与后一候选行为时长阈值下的比例无明显差距,则将前一候选行为时长阈值作为无效行为时长阈值,用于无效行为样本的选取。
需要说明的是,为了不影响用户体验,仅选取用户组中部分用户,例如5%的用户进行有效行为测试,且在部分用户中,对不同用户进行不同候选行为时长阈值下的有效行为测试。
基于上述任一实施例,该方法还包括:获取用户的实时用户数据;将实时用户数据输入到行为识别模型中,得到行为识别模型输出的行为识别结果;其中,行为识别模型是基于有效行为样本和无效行为样本训练得到的。
此处,实时用户数据即用户当前正在进行的用户数据。将获取的用户的实时用户数据输入到预设的行为识别模型中进行识别,识别目标是对用户的实时用户数据进行判断,确定实时行为是否是有效行为。
进一步地,该行为识别模型可以是预先基于逻辑回归算法对从用户的用户数据中选取的有效行为样本和无效行为样本训练得到的。可以理解的是,逻辑回归算法是一种二分类算法,即通过识别概率输出行为识别结果“有效行为”或“无效行为”,有效行为的概率高于0.5的输出“有效行为”,相应的,有效行为概率低于0.5的输出“无效行为”。有效行为样本和无效行为样本是从同一用户或同一类用户在一段时间之前在同一平台上所进行同类操作生成的用户数据中选取的,有效行为样本为正样本,无效行为样本为负样本。同一类用户的判断可根据用户的基础信息确定,例如:性别、年龄、职业等。例如:从学生A在XX音乐APP上的用户数据选取的有效行为样本和无效行为样本,可以作为学生A对应的行为识别模型的训练集或者学生类用户对应的行为识别模型的训练集。本发明实施例将有效行为样本和无效行为样本作为训练样本集,再利用逻辑回归算法对预设的分类模型进行训练,最终得到训练好的行为识别模型。
此外,行为识别模型还可以是LSTM(Long Short-Term Memory,长短期记忆网络)以及其他类型的模型,本发明实施例对此不作具体限定。
进一步地,本发明实施例中,针对上述行为识别模型,可以将其分类为离线模型和在线模型。离线模型即利用距离当前时间较长的训练样本集训练得到的模型,例如:利用一天或一周前采集的用户数据中选取的有效行为样本和无效行为样本。而在线模型即利用距离当前时间较短的训练样本集训练得到的模型,例如:利用用户10分钟前的进行的用户数据中选取的有效行为样本和无效行为样本。可以理解的是,离线模型的更新不能够实时,故而有所滞后,而采用在线模型能够根据用户的实时用户数据不断更新,识别率更高。具体的,本发明实施例通过kafka实时采集数据,Spark Streaming根据最近一段时间的用户数据结合逻辑回归算法实时更新模型。需要说明的是,离线模型和在线模型可以共存,离线模型可以作为在线模型的初始模型以及用于样本的纠错。
基于上述任一实施例,图2是本发明实施例提供的一种个性化推荐方法流程示意图,如图2所示,该方法包括:
步骤210,基于有效行为检测方法,得到用户的实时用户数据对应的行为识别结果。
步骤220,若行为识别结果为有效行为,则基于实时用户数据生成用户画像。
具体地,若行为识别结果为有效行为,即实时用户数据是有效行为,仅应用行为识别结果为有效行为的实时用户数据进行用户画像,相当于对用户行为进行过滤,由此得到的用户画像将更加准确。此处,基于实时用户数据的用户画像可以是通过Spark Streaming实现的。
步骤230,基于用户画像进行个性化推荐。
具体地,在此基础上根据用户画像进行召回,并把召回结果推荐给该用户作为该用户的个性化推荐。
本发明实施例提供的个性化推荐方法,在有效性为检测方法的基础上实现了有效行为的筛选,从而提高了用户画像准确性,实现了准确可靠的个性化推荐。
基于上述任一实施例,该方法中,步骤230具体包括:基于用户画像获取第一召回内容;基于预设召回方法获取第二召回内容;基于第一召回内容和第二召回内容,进行个性化推荐。
具体地,第一召回内容基于用户画像得到的召回内容,第二召回内容是预设召回方法得到的召回内容。此处,预设召回方法即预先设定的除画像召回之外的其余召回方法,例如基于用户、基于内容以及基于模型的协同过滤召回方法,基于相似内容的召回方法,基于时间和热度排序的召回方法等。召回内容即待推荐给用户的内容,在音乐APP环境下,召回内容为歌曲、歌单等。
在得到第一召回内容和第二召回内容后,可以融合第一召回内容和第二召回内容,并重新进行排序,最终按照排序结果依次展示给用户。
基于上述任一实施例,该方法中,所述基于第一召回内容和第二召回内容,进行个性化推荐,具体包括:基于用户画像确定第一召回内容和/或第二召回内容的权重;基于第一召回内容、第二召回内容以及权重,进行个性化推荐。
具体地,为了确保个性化推荐的准确性,可以根据用户画像中包含的标签,确定第一召回内容和/或第二召回内容的权重。例如,用户画像中包含“经常挂机”、“偶尔挂机”、“不挂机”一类的标签,可以根据对应的标签设置第一召回内容的权重,挂机的情况越多,则对应第一召回内容的权重越小;还可以根据对应的标签设置第二召回内容中,基于相似歌曲召回得到的召回内容的权重,挂机的情况越多,则对应基于相似歌曲召回得到的召回内容的权重越小。此处,具体的权重值可以采用ABTest配置管理平台对线上用户进行分流测试得到。
基于上述任一实施例,一种有效行为检测和个性化推荐方法,包括如下步骤:
通过Kafka实时采集用户在音乐APP上的用户数据,例如听歌、切歌、暂停、关闭等行为,并将用户数据存储到HDFS(Hadoop Distributed File System,分布式文件系统)集群上。
根据用户的基础信息和用户数据,对用户进行初始画像,并根据初始画像将用户分配至对应的用户组。
在用户组内,根据组内各用户的听歌时长,统计平均听歌时长,并基于平均听歌时长ti得到第一有效行为时长阈值ti和第二有效行为时长阈值2ti。选取用户的用户数据中[0,ti]部分作为有效行为样本;此外,选取用户两次相邻的操作行为时刻之间的用户数据作为有效行为样本,且两次相邻的操作行为时刻之间的时间间隔不超过第二有效行为时长阈值2ti。
在用户组内,选取小部分用户,并生成新的抽样用户组。假设预先设置有4个候选行为时长阈值,则将抽样用户组分为4个小组,每一小组对应一个候选行为时长阈值进行有效行为测试。此处,4个候选行为时长阈值分别为ti、2ti、3ti和4ti。候选行为时长阈值为ti时,在ti时刻暂停小组1的歌单播放,获取小组1中各用户的反应结果,即是否重新点击播放歌单,并计算未重新点击播放歌单的用户占比ratio_1。同样地,在2ti时刻暂停小组2的歌单播放,计算小组2中未重新点击播放歌单的用户占比ratio_2。基于上述规则得到用户占比ratio_3和ratio_4。若ratio_n+1与ratio_n的差值小于预设差值阈值,则将对应的候选行为时长阈值作为无效行为时长阈值n*ti。选取用户的用户数据中超出n*ti且不包含操作行为时刻的部分作为无效行为样本。
此外,还可以设定候选循环次数为1、2、3、4。对应在一次歌单循环结束后暂停小组1的歌单播放,获取小组1中各用户的反应结果,即是否重新点击播放歌单,并计算未重新点击播放歌单的用户占比ratio’_1。同样地,在两次歌单循环结束后暂停小组2的歌单播放,计算小组2中未重新点击播放歌单的用户占比ratio’_2。基于上述规则得到用户占比ratio’_3和ratio’_4。若ratio’_n+1与ratio’_n的差值小于预设差值阈值,则将对应的候选循环次数设置为n。选取用户的用户数据中歌单循环次数超出n次且不包含操作行为时刻的部分作为无效行为样本。
再者,选取设备运行状态满足预设无效设备运行状态条件,且不包含操作行为时刻的用户数据,作为无效行为样本。
基于上述步骤得到有效行为样本和无效行为样本构建样本训练集,将有效行为样本的有效数据标识为1,无效行为样本的有效数据标识为0,记为train_target;根据用户的用户数据构建用户特征,记为train_data,最后采用逻辑回归算法对是否是有效行为进行概率预估,输入为train_data,输出为有效行为的概率,当概率值大于0.5时为有效行为,小于0.5时为无效行为。需要说明的是,本发明实施例对于该模型会将预测的结果和线上实际的结果train_target进行比较,并标记被错分的样本,重新训练模型,得到行为识别模型。
在训练得到行为识别模型后,将实时用户数据输入到行为识别模型中,得到实时用户数据对应的有效行为标识,即行为识别结果train_target;筛选train_target为1的实时用户数据,则基于该实时用户数据生成用户画像,并基于用户画像进行个性化推荐。
基于上述任一实施例,图3是本发明实施例提供的一种有效行为检测系统结构示意图,如图3所示,有效行为检测系统包括用户数据获取单元310、检测参数获取单元320和行为检测单元330;
其中,用户数据获取单元310用于获取用户的用户数据;
检测参数获取单元320用于基于所述用户数据,确定所述用户的行为检测参数;所述行为检测参数包括操作行为时刻,还包括设备运行状态和/或针对有效行为测试的反应结果;
行为检测单元330用于基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本。
本发明实施例提供的有效行为检测系统,根据用户数据,确定用户的行为检测参数,进而从用户数据中选取有效行为样本和/或无效行为样本,实现了准确的有效行为检测,以便于将有效行为检测得到的有效行为应用于用户画像,从而提高用户画像的准确性,实现准确可靠的个性化推荐。
基于上述任一实施例,行为检测单元330具体用于:
确定所述用户数据中,所述操作行为时刻对应的位置;
从所述用户数据中选取所述操作行为时刻后的部分,作为所述有效行为样本;
或,从所述用户数据中选取两个相邻的所述操作行为时刻之间的部分,作为所述有效行为样本;
所述有效行为样本的时长小于等于有效行为时长阈值。
基于上述任一实施例,行为检测单元330具体用于:
确定所述用户数据中,所述操作行为时刻对应的位置,以及无效行为时长阈值对应时刻的位置;
从所述用户数据中选取超出所述无效行为时长阈值,且不包含所述操作行为时刻的部分,作为所述无效行为样本。
基于上述任一实施例,行为检测单元330具体用于:
从用户数据中选取所述设备运行状态满足预设无效设备运行状态条件,且不包含所述操作行为时刻的部分,作为所述无效行为样本;
其中,所述预设无效设备运行状态条件包括:
所述设备运行状态中的行为时间在预设无效时间段内;
所述行为时间在所述预设无效时间段内,所述设备运行状态中的用户端为PC端,且所述设备运行状态中的播放模式为耳机播放模型;
所述设备运行状态中的用户端状态为充电状态,且所述播放模式为耳机播放模型中的至少一种。
基于上述任一实施例,有效行为检测系统还包括阈值获取单元;阈值获取单元用于:
基于所述用户数据,确定所述用户的初始画像;
基于所述初始画像,将所述用户分配至对应的用户组;
获取所述用户组对应的有效行为时长阈值和/或无效行为时长阈值;
其中,所述有效行为时长阈值是基于所述用户组的平均行为时长得到的;所述无效行为时长阈值基于所述用户组中的部分用户的所述反应结果得到。
基于上述任一实施例,有效行为检测系统还包括实时检测单元;实时检测单元用于:
获取所述用户的实时用户数据;
将所述实时用户数据输入到行为识别模型中,得到所述行为识别模型输出的行为识别结果;其中,所述行为识别模型是基于所述有效行为样本和所述无效行为样本训练得到的。
基于上述任一实施例,图4为本发明实施例提供的一种个性化推荐系统结构示意图,如图4所示,个性化推荐系统包括有效行为检测单元410、用户画像单元420和个性化推荐单元430;
其中,有效行为检测单元410用于基于有效行为检测方法,得到用户的实时用户数据对应的行为识别结果;
用户画像单元420用于若所述行为识别结果为有效行为,则基于所述实时用户数据生成用户画像;
个性化推荐单元430用于基于所述用户画像进行个性化推荐。
基于上述任一实施例,个性化推荐单元430包括:
第一召回子单元,用于基于所述用户画像获取第一召回内容;
第二召回子单元,用于基于预设召回方法获取第二召回内容;
推荐子单元,用于基于所述用户画像确定所述第一召回内容和/或所述第二召回内容的权重;
基于所述第一召回内容、所述第二召回内容以及所述权重,进行个性化推荐。
图5是本发明实施例提供的一种电子设备的结构框图,参照图5,所述电子设备,包括:处理器(processor)501、通信接口(Communications Interface)302、存储器(memory)503和总线504,其中,处理器501,通信接口502,存储器503通过总线504完成相互间的通信。处理器501可以调用存储器503中的逻辑指令,以执行如下方法:获取用户的用户数据;基于所述用户数据,确定所述用户的行为检测参数;所述行为检测参数包括操作行为时刻,还包括设备运行状态和/或针对有效行为测试的反应结果;基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本。
处理器501还可以调用存储器503中的逻辑指令,以执行如下方法:基于有效行为检测方法,得到用户的实时用户数据对应的行为识别结果;若所述行为识别结果为有效行为,则基于所述实时用户数据生成用户画像;基于所述用户画像进行个性化推荐。
本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取用户的用户数据;基于所述用户数据,确定所述用户的行为检测参数;所述行为检测参数包括操作行为时刻,还包括设备运行状态和/或针对有效行为测试的反应结果;基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本。
本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:基于有效行为检测方法,得到用户的实时用户数据对应的行为识别结果;若所述行为识别结果为有效行为,则基于所述实时用户数据生成用户画像;基于所述用户画像进行个性化推荐。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行每个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种有效行为检测方法,其特征在于,包括:
获取用户的用户数据;
基于所述用户数据,确定所述用户的行为检测参数;所述行为检测参数包括操作行为时刻,还包括设备运行状态和/或针对有效行为测试的反应结果;其中,所述设备运行状态是指用户所使用的设备在运行中的状态参数,设备运行状态包括设备类型、设备运行时段、设备网络状态、设备电源状态、设备外设连接状态中的至少一种;所述有效行为测试是由服务端抽取部分用户,在用户通过设备运行软件程序时通过需要用户反馈操作的方式对用户当前的行为是否为有效行为进行测试,反应结果即用户是否针对有效行为测试反馈操作;
基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本。
2.根据权利要求1所述的有效行为检测方法,其特征在于,所述基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本,具体包括:
确定所述用户数据中,所述操作行为时刻对应的位置;
从所述用户数据中选取所述操作行为时刻后的部分,作为所述有效行为样本;
或,从所述用户数据中选取两个相邻的所述操作行为时刻之间的部分,作为所述有效行为样本;
所述有效行为样本的时长小于等于有效行为时长阈值。
3.根据权利要求1所述的有效行为检测方法,其特征在于,所述基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本,具体包括:
确定所述用户数据中,所述操作行为时刻对应的位置,以及无效行为时长阈值对应时刻的位置;
从所述用户数据中选取超出所述无效行为时长阈值,且不包含所述操作行为时刻的部分,作为所述无效行为样本。
4.根据权利要求1所述的有效行为检测方法,其特征在于,所述基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本,具体包括:
从所述用户数据中选取所述设备运行状态满足预设无效设备运行状态条件,且不包含所述操作行为时刻的部分,作为所述无效行为样本;
其中,所述预设无效设备运行状态条件包括:
所述设备运行状态中的设备运行时段在预设无效时间段内;
所述设备运行时段在所述预设无效时间段内,所述设备运行状态中的设备类型为PC端,且所述设备运行状态中的设备外设连接状态为耳机连接;
所述设备运行状态中的设备网络状态为WiFi连接,所述设备运行状态中的设备电源状态为电池充电状态,且所述设备外设连接状态为耳机连接中的至少一种。
5.根据权利要求1至4中任一项所述的有效行为检测方法,其特征在于,所述基于所述行为检测参数,从所述用户数据中选取有效行为样本和/或无效行为样本,之前还包括:
基于所述用户数据,确定所述用户的初始画像;
基于所述初始画像,将所述用户分配至对应的用户组;
获取所述用户组对应的有效行为时长阈值和/或无效行为时长阈值;
其中,所述有效行为时长阈值是基于所述用户组的平均行为时长得到的;所述无效行为时长阈值基于所述用户组中的部分用户的所述反应结果得到。
6.根据权利要求1至4中任一项所述的有效行为检测方法,其特征在于,还包括:
获取所述用户的实时用户数据;
将所述实时用户数据输入到行为识别模型中,得到所述行为识别模型输出的行为识别结果;其中,所述行为识别模型是基于所述有效行为样本和所述无效行为样本训练得到的。
7.一种个性化推荐方法,其特征在于,包括:
基于如权利要求6所述的有效行为检测方法,得到用户的实时用户数据对应的行为识别结果;
若所述行为识别结果为有效行为,则基于所述实时用户数据生成用户画像;
基于所述用户画像进行个性化推荐。
8.根据权利要求7所述的个性化推荐方法,其特征在于,所述基于所述用户画像进行个性化推荐,具体包括:
基于所述用户画像获取第一召回内容;
基于预设召回方法获取第二召回内容;
基于所述用户画像确定所述第一召回内容和/或所述第二召回内容的权重;
基于所述第一召回内容、所述第二召回内容以及所述权重,进行个性化推荐。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的有效行为检测方法或如权利要求7或8所述的个性化推荐方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述的有效行为检测方法或如权利要求7或8所述的个性化推荐方法的步骤。
CN201910794970.6A 2019-08-27 2019-08-27 有效行为检测和个性化推荐方法 Active CN110516151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910794970.6A CN110516151B (zh) 2019-08-27 2019-08-27 有效行为检测和个性化推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910794970.6A CN110516151B (zh) 2019-08-27 2019-08-27 有效行为检测和个性化推荐方法

Publications (2)

Publication Number Publication Date
CN110516151A CN110516151A (zh) 2019-11-29
CN110516151B true CN110516151B (zh) 2022-03-22

Family

ID=68625382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910794970.6A Active CN110516151B (zh) 2019-08-27 2019-08-27 有效行为检测和个性化推荐方法

Country Status (1)

Country Link
CN (1) CN110516151B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378040A (zh) * 2021-05-24 2021-09-10 山东浪潮爱购云链信息科技有限公司 一种用于推广的用户行为分析方法及设备
CN113469645A (zh) * 2021-06-21 2021-10-01 广州政企互联科技有限公司 一种政策数据智能入库方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120110203A (ko) * 2011-03-29 2012-10-10 성균관대학교산학협력단 상호 진화 연산을 이용한 데이터 추천 방법 및 이러한 방법을 사용하는 장치
CN102956009A (zh) * 2011-08-16 2013-03-06 阿里巴巴集团控股有限公司 一种基于用户行为的电子商务信息推荐方法与装置
CN107038213A (zh) * 2017-02-28 2017-08-11 华为技术有限公司 一种视频推荐的方法及装置
CN109034965A (zh) * 2018-07-16 2018-12-18 深圳美图创新科技有限公司 一种产品推荐方法、计算设备及存储介质
CN109670104A (zh) * 2018-11-12 2019-04-23 深圳壹账通智能科技有限公司 基于机器学习的信息推送方法、设备、装置及存储介质
CN109783730A (zh) * 2019-01-03 2019-05-21 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质
CN109785045A (zh) * 2018-12-14 2019-05-21 深圳壹账通智能科技有限公司 一种基于用户行为数据的推送方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120110203A (ko) * 2011-03-29 2012-10-10 성균관대학교산학협력단 상호 진화 연산을 이용한 데이터 추천 방법 및 이러한 방법을 사용하는 장치
CN102956009A (zh) * 2011-08-16 2013-03-06 阿里巴巴集团控股有限公司 一种基于用户行为的电子商务信息推荐方法与装置
CN107038213A (zh) * 2017-02-28 2017-08-11 华为技术有限公司 一种视频推荐的方法及装置
CN109034965A (zh) * 2018-07-16 2018-12-18 深圳美图创新科技有限公司 一种产品推荐方法、计算设备及存储介质
CN109670104A (zh) * 2018-11-12 2019-04-23 深圳壹账通智能科技有限公司 基于机器学习的信息推送方法、设备、装置及存储介质
CN109785045A (zh) * 2018-12-14 2019-05-21 深圳壹账通智能科技有限公司 一种基于用户行为数据的推送方法和装置
CN109783730A (zh) * 2019-01-03 2019-05-21 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN110516151A (zh) 2019-11-29

Similar Documents

Publication Publication Date Title
CN108304379B (zh) 一种文章识别方法、装置及存储介质
US20180255009A1 (en) Emoji recommendation method and apparatus
CN109218390B (zh) 用户筛选方法及装置
CN108319974B (zh) 数据处理方法、装置、存储介质和电子装置
CN110401844A (zh) 视频直播策略的生成方法、装置、设备及可读介质
CN109947438B (zh) 基于机器学习的游戏安装方法及电子设备、可读存储介质
CN108875055A (zh) 一种答案提供方法及设备
CN108494841B (zh) 一种基于终端设备使用情况的管控方法及装置
CN110516151B (zh) 有效行为检测和个性化推荐方法
CN110166624B (zh) 消息免打扰方法、装置、设备和计算机可读存储介质
CN107908701A (zh) 音乐推荐的方法、装置、存储介质及终端设备
CN112241327A (zh) 分享信息处理方法、装置、存储介质与电子设备
CN113535991A (zh) 一种多媒体资源推荐方法、装置、电子设备及存储介质
CN110134577A (zh) 显示用户情绪的方法及设备
CN112052316A (zh) 模型评估方法、装置、存储介质及电子设备
CN113672748A (zh) 多媒体信息播放方法及装置
CN110196805B (zh) 数据处理方法、装置、存储介质和电子装置
US20230325944A1 (en) Adaptive wellness collaborative media system
CN111368131B (zh) 用户关系识别方法、装置、电子设备及存储介质
CN113485993A (zh) 数据识别方法以及装置
CN112328895A (zh) 用户画像生成方法、装置、服务器及存储介质
CN109413663B (zh) 一种信息处理方法和设备
CN113572841B (zh) 信息推送方法及装置
CN110557461B (zh) 消息推送方法、设备及存储介质
CN110807179A (zh) 一种用户识别方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant