CN115344774A - 用户账号的筛选方法、装置及服务器 - Google Patents
用户账号的筛选方法、装置及服务器 Download PDFInfo
- Publication number
- CN115344774A CN115344774A CN202110519075.0A CN202110519075A CN115344774A CN 115344774 A CN115344774 A CN 115344774A CN 202110519075 A CN202110519075 A CN 202110519075A CN 115344774 A CN115344774 A CN 115344774A
- Authority
- CN
- China
- Prior art keywords
- user
- user account
- target
- code
- screening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开关于一种用户账号的筛选方法、装置及服务器,属于计算机应用技术领域。其中,该用户账号的筛选方法包括:获取筛选目标用户账号的策略集合及目标用户账号对应的兴趣标签集合;确定策略集合与兴趣标签集合对应的目标笛卡尔积,其中,目标笛卡尔积中包括一个或多个目标元素;根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,及目标笛卡尔积,确定每个目标元素对应的目标用户编码;基于目标用户编码,查询用户编码库,以获取用户编码与目标用户编码匹配的目标用户账号,其中,用户编码库中包括用户账号与用户编码的映射关系。由此,通过这种用户账号的筛选方法,提升了用户账号圈选效率,而且通过编码方式存储用户画像数据,节省了存储空间。
Description
技术领域
本公开涉及计算机应用技术领域,尤其涉及一种用户账号的筛选方法、装置及服务器。
背景技术
随着人工智能技术的兴起,各种短视频类、资讯类等feed流产品层出不穷,人们花在资讯类、短视频类等APP中的时间越来越多。资源推送是feed流产品中的一个常见功能,如向用户推荐视频、投放广告等。如果通过随机方式或全覆盖方式向feed流产品的用户推送多媒体资源,容易导致推送的多媒体资源不符合用户的兴趣点,从而影响了多媒体资源的转化效果,影响了用户体验。
相关技术中,通常通过根据多媒体资源的特征进行用户筛选,并将多媒体资源推送给筛选出的目标用户,以提升多媒体资源的转化效果。现有技术中通常是通过将用户设置的筛选策略与APP内所有用户的用户数据进行匹配,以筛选出与筛选策略匹配的用户。然而,这种用户筛选方式需要将筛选策略与大量的用户数据进行匹配,计算复杂度高,从而导致用户筛选的效率低下。
发明内容
本公开提供一种用户账号的筛选方法、装置、服务器、存储介质及计算机程序产品,以至少解决相关技术中,通过将筛选策略与大量的用户数据进行匹配的用户筛选方式,计算复杂度高、效率低下的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种用户账号的筛选方法,包括:获取筛选目标用户账号的策略集合及所述目标用户账号对应的兴趣标签集合;确定所述策略集合与所述兴趣标签集合对应的目标笛卡尔积,其中,所述目标笛卡尔积中包括一个或多个目标元素;根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,及所述目标笛卡尔积,确定每个所述目标元素对应的目标用户编码,其中,所述策略集合中的策略与所述兴趣标签集合中的兴趣标签是从所述各用户特征集合中选取的,所述目标笛卡尔积为所述各用户特征集合对应的笛卡尔积的子集;基于所述目标用户编码,查询用户编码库,以获取用户编码与所述目标用户编码匹配的目标用户账号,其中,所述用户编码库中包括用户账号与用户编码的映射关系。
可选地,在本公开第一方面实施例一种可能的实现方式中,所述策略集合,包括以下信息中的至少一个:所述目标用户账号在设定时段内发生交互行为的多媒体资源展示平台、所述目标用户账号在设定时段内发生交互行为的多媒体资源展示平台中的展示位。
可选地,在本公开第一方面实施例另一种可能的实现方式中,在所述基于所述目标编码,查询用户编码库之前,还包括:
获取候选用户账号的历史交互数据;
利用训练生成的用户兴趣标签预测模型,对所述候选用户账号的历史交互数据进行处理,以预测所述候选用户账号对应的兴趣标签;
确定所述候选用户账号对应的兴趣标签集合与所述历史交互数据对应的集合的候选笛卡尔积,其中,所述候选笛卡尔积中包括一个或多个候选元素;
根据所述预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,将与每个所述候选元素对应的编码确定为所述候选用户账号对应的用户编码;
将所述候选用户账号对应的用户编码与所述候选用户账号的映射关系,存入所述用户编码库。
可选地,在本公开第一方面实施例再一种可能的实现方式中,在所述利用训练生成的用户兴趣标签预测模型,对所述候选用户账号的历史交互数据进行处理之前,还包括:
获取各个参考用户账号的历史交互数据,其中,所述历史交互数据中包括各个交互行为所属的各个交互类型、各个交互行为对应的各个交互对象、每个交互对象对应的交互次数、及每个交互对象对应的交互时长;
获取每个所述交互对象所属的类型;
根据每个所述交互对象所属的类型、各个交互行为所属的各个交互类型、每个交互对象的交互次数及每个交互对象对应的交互时长,确定每个所述参考用户账号与每类交互对象的关联度;
根据每个所述参考用户账号与每类交互对象的关联度,对每个所述参考用户账号对应的兴趣标签进行标注;
基于标注后的参考用户账号的历史交互数据及对应的兴趣标签,对初始标签识别模型进行训练,以生成所述用户兴趣标签预测模型。
可选地,在本公开第一方面实施例又一种可能的实现方式中,所述根据每个所述参考用户账号与每类交互对象的关联度,对每个所述参考用户账号对应的兴趣标签进行标注,包括:
在所述参考用户账号与任一类交互对象的关联度大于或等于关联度阈值时,利用所述任一类交互对象所属的类型对所述参考用户账号进行标注。
可选地,在本公开第一方面实施例又一种可能的实现方式中,所述交互对象包括社区直播视频、社区短视频、广告视频中的至少一种;其中,在所述交互对象为直播视频时,所述交互行为所属的交互类型包括观看时长、打赏、点赞、评论、转发中的至少一种;在所述交互对象为社区短视频时,所述交互行为所属的交互类型包括点击、播放时长、点赞、评论、转发中的至少一种;在所述交互对象为广告视频时,所述交互行为所属的交互类型包括点击、播放时长、表单提交、付费中的至少一种。
可选地,在本公开第一方面实施例另一种可能的实现方式中,所述获取每个所述交互对象所属的类型,包括:
获取每个所述交互对象对应的文本信息;
对每个所述交互对象对应的文本信息进行解析处理,以确定每个所述交互对象对应的商业关键词;
根据每个所述交互对象对应的商业关键词,确定每个所述交互对象所属的类型。
可选地,在本公开第一方面实施例再一种可能的实现方式中,所述基于所述目标编码,查询用户编码库,以获取用户编码与所述目标用户编码匹配的目标用户账号之后,还包括:
确定所述目标用户账号的数量;
返回所述目标用户账号的数量,以在用户账号筛选设置界面中显示所述目标用户的数量。
可选地,在本公开第一方面实施例又一种可能的实现方式中,所述用户账号筛选设置界面中包括策略设置菜单与兴趣标签设置菜单,所述获取筛选目标用户账号的策略集合及所述目标用户账号对应的兴趣标签集合,包括:
根据所述策略设置菜单与所述兴趣标签设置菜单中输入的目标值,确定所述策略集合与所述兴趣标签集合。
根据本公开实施例的第二方面,提供一种用户账号的筛选装置,包括:第一获取模块,被配置为执行获取筛选目标用户账号的策略集合及所述目标用户账号对应的兴趣标签集合的步骤;第一确定模块,被配置为执行确定与所述策略集合与所述兴趣标签集合对应的目标笛卡尔积,其中,所述目标笛卡尔积中包括一个或多个目标元素的步骤;第二确定模块,被配置为执行根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,及所述目标笛卡尔积,确定每个所述目标元素对应的目标用户编码,其中,所述策略集合中的策略与所述兴趣标签集合中的兴趣标签是从所述各用户特征集合中选取的,所述目标笛卡尔积为所述各用户特征集合对应的笛卡尔积的子集的步骤;查询模块,被配置为执行基于所述目标用户编码,查询用户编码库,以获取用户编码与所述目标用户编码匹配的目标用户账号,其中,所述用户编码库中包括用户账号与用户编码的映射关系的步骤。
可选地,在本公开第二方面实施例一种可能的实现方式中,所述策略集合,包括以下信息中的至少一个:所述目标用户账号在设定时段内发生交互行为的多媒体资源展示平台、所述目标用户账号在设定时段内发生交互行为的多媒体资源展示平台中的展示位。
可选地,在本公开第二方面实施例另一种可能的实现方式中,所述装置,还包括:
第二获取模块,被配置为执行获取候选用户账号的历史交互数据的步骤;
预测模块,被配置为执行利用训练生成的用户兴趣标签预测模型,对所述候选用户账号的历史交互数据进行处理,以预测所述候选用户账号对应的兴趣标签的步骤;
第三确定模块,被配置为执行确定所述候选用户账号对应的兴趣标签集合及与所述历史交互数据对应的集合的候选笛卡尔积,其中,所述候选笛卡尔积中包括一个或多个候选元素的步骤;
第四确定模块,被配置为执行根据所述预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,将与每个所述候选元素对应的编码确定为所述候选用户账号对应的用户编码的步骤;
存储模块,被配置为执行将所述候选用户账号对应的用户编码与所述候选用户账号的映射关系,存入所述用户编码库的步骤。
可选地,在本公开第二方面实施例再一种可能的实现方式中,所述装置,还包括:
第三获取模块,被配置为执行获取各个参考用户账号的历史交互数据的步骤,其中,所述历史交互数据中包括各个交互行为所属的各个交互类型、各个交互行为对应的各个交互对象、每个交互对象对应的交互次数、及每个交互对象对应的交互时长的步骤;
第四获取模块,被配置为执行获取每个所述交互对象所属的类型的步骤;
第五确定模块,被配置为执行根据每个所述交互对象所属的类型、各个交互行为所属的各个交互类型、每个交互对象的交互次数及每个交互对象对应的交互时长,确定每个所述参考用户账号与每类交互对象的关联度的步骤;
标注模块,被配置为执行根据每个所述参考用户账号与每类交互对象的关联度,对每个所述参考用户账号对应的兴趣标签进行标注的步骤;
训练模块,被配置为执行基于标注后的参考用户账号的历史交互数据及对应的兴趣标签,对初始标签识别模型进行训练,以生成所述用户兴趣标签预测模型的步骤。
可选地,在本公开第二方面实施例又一种可能的实现方式中,所述标注模块,包括:
标注单元,被配置为执行在所述参考用户账号与任一类交互对象的关联度大于或等于关联度阈值时,利用所述任一类交互对象所属的类型对所述参考用户账号进行标注的步骤。
可选地,在本公开第二方面实施例又一种可能的实现方式中,所述交互对象包括社区直播视频、社区短视频、广告视频中的至少一种;其中,在所述交互对象为直播视频时,所述交互行为所属的交互类型包括观看时长、打赏、点赞、评论、转发中的至少一种;在所述交互对象为社区短视频时,所述交互行为所属的交互类型包括点击、播放时长、点赞、评论、转发中的至少一种;在所述交互对象为广告视频时,所述交互行为所属的交互类型包括点击、播放时长、表单提交、付费中的至少一种。
可选地,在本公开第二方面实施例另一种可能的实现方式中,所述第四获取模块,包括:
获取单元,被配置为执行获取每个所述交互对象对应的文本信息的步骤;
第一确定单元,被配置为执行对每个所述交互对象对应的文本信息进行解析处理,以确定每个所述交互对象对应的商业关键词的步骤;
第二确定单元,被配置为执行根据每个所述交互对象对应的商业关键词,确定每个所述交互对象所属的类型的步骤。
可选地,在本公开第二方面实施例再一种可能的实现方式中,所述装置,还包括:
第六确定模块,被配置为执行确定所述目标用户账号的数量的步骤;
返回模块,被配置为执行返回所述目标用户账号的数量,以在用户账号筛选设置界面中显示所述目标用户账号的数量的步骤。
可选地,在本公开第二方面实施例又一种可能的实现方式中,所述用户账号筛选设置界面中包括策略设置菜单与兴趣标签设置菜单,所述第一获取模块,包括:
第三确定单元,被配置为执行根据所述策略设置菜单与所述兴趣标签设置菜单中输入的目标值,确定所述策略集合与所述兴趣标签集合的步骤。
根据本公开实施例的第三方面,提供一种服务器,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如前所述的用户账号的筛选方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如前所述的用户账号的筛选方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如前所述的用户账号的筛选方法。
本公开的实施例提供的技术方案至少带来以下有益效果:通过确定用于筛选目标用户账号的策略集合与兴趣标签集合对应的目标笛卡尔积,并根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,确定目标笛卡尔积中每个目标元素对应的目标用户编码,其中,策略集合中的策略与兴趣标签集合中的兴趣标签是从各用户特征集合中选取的,目标笛卡尔积为各用户特征集合对应的笛卡尔积的子集,进而基于目标用户编码,查询用户编码库,以获取用户编码与目标用户编码匹配的目标用户账号。由此,通过预先对用户账号的兴趣点进行识别并编码存储,并将用于筛选目标用户账号的策略集合与兴趣标签集合对应的目标用户编码与用户编码库中的用户编码进行匹配,以从用户编码库中选取符合策略集合且兴趣点与兴趣标签集合相符的用户账号作为筛选出的目标用户账号,从而通过筛选条件对应的编码与用户对应的用户编码进行匹配,不仅降低了用户账号筛选的数据处理量,提升了筛选效率,而且通过编码方式存储用户画像数据,节省了存储空间。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种用户账号的筛选方法的流程图。
图2是根据一示例性实施例示出的另一种用户账号的筛选方法的流程图。
图3是一种用户账号筛选设置界面的示意图。
图4是根据一示例性实施例示出的再一种用户账号的筛选方法的流程图。
图5是根据一示例性实施例示出的一种用户账号的筛选装置框图。
图6是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种用户账号的筛选方法的流程图,如图1所示,该用户账号的筛选方法用于服务器中,包括以下步骤。
在步骤101中,获取筛选目标用户账号的策略集合及目标用户账号对应的兴趣标签集合。
需要说明的是,本公开实施例的用户账号的筛选方法可以由本公开实施例的用户账号的筛选装置执行,本公开实施例的用户账号的筛选装置可以配置在任意服务器中,以执行本公开实施例的用户账号的筛选方法,实现特定用户的筛选。本公开实施例的用户账号的筛选方法可以应用在任意对用户群进行特定用户筛选的场景。
比如,本公开实施例的用户账号的筛选方法可以应用在短视频APP中,以对短视频APP的用户群对应的数量分布、兴趣点分布等进行分析;或者,还可以在实现多媒体资源推荐时,根据多媒体资源的特征从短视频APP的用户群中筛选出对多媒体资源感兴趣的用户账号,进行精准推荐,等等。
其中,目标用户账号,是指用户特征与策略集合及兴趣标签集合匹配的用户账号。
其中,筛选目标用户账号的策略集合,是指根据实际需求设置的筛选规则构成的集合。
其中,目标用户账号对应的兴趣标签集合,是指根据实际需求设置的、用于从用户的兴趣点特征对用户账号进行筛选的关键词构成的集合。需要说明的是,兴趣标签可以包括教育、金融、生活服务、商务服务等一级类别,各一级类别中还可以包括多个二级类别,各二级类别中还可以包括多个三级类别等。比如,教育行业中还可以包括早教与学前教育、基础教育、语言培训、学历教育等二级行业类别。实际使用时,可以根据实际需要及具体的应用场景,设置兴趣标签所包括的具体类别以及其等级划分,本公开实施例对此不做限定。
在本公开实施例中,可以在客户端提供用户账号筛选设置界面,以使使用者可以通过用户账号筛选设置界面设置策略集合与兴趣标签集合,进而客户端根据使用者设置的策略集合与兴趣标签集合生成用户账号筛选指令,并发送至客户端。从而,服务器可以在获取到用户账号筛选指令时,对用户账号筛选指令进行解析处理,以确定用户账号筛选指令中包括的策略集合与兴趣标签集合。
举例来说,本公开实施例的用户账号的筛选方法应用在短视频APP中的广告投放场景时,可以通过网页或客户端的方式为广告主提供用户账号筛选设置界面,以使广告主可以根据待投放广告进行投放的页面、展示位、广告类型等信息,确定筛选目标用户账号的策略集合与兴趣标签集合,并在用户账号筛选界面中进行设置,从而短视频APP的服务器在获取到用户账号筛选设置界面发送的用户账号筛选指令时,可以对用户账号筛选指令进行解析处理,以确定用户账号筛选指令中包括的策略集合及兴趣点集合,以将待投放的广告推荐给筛选出的目标用户账号。
在步骤102中,确定策略集合与兴趣标签集合对应的目标笛卡尔积,其中,目标笛卡尔积中包括一个或多个目标元素。
在本公开实施例中,由于筛选目标用户账号的策略集合及兴趣标签集合,可以分别表示用于筛选目标用户账号的部分特征,因此可以通过确定策略集合与兴趣标签集合对应的目标笛卡尔积,以对策略集合中的各个策略与兴趣标签集合中的各个兴趣标签进行整合,进而通过目标笛卡尔积表示用于筛选目标用户账号的完整特征。其中,目标笛卡尔积中的每个目标元素可以表示用于筛选目标用户账号的一个特征。
举例来说,策略集合为{A,B},兴趣标签集合为{E},则可以确定策略集合与兴趣标签集合对应的目标笛卡尔积为{(A,E),(B,E)}。
步骤103,根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,及目标笛卡尔积,确定每个目标元素对应的目标用户编码,其中,策略集合中的策略与兴趣标签集合中的兴趣标签是从各用户特征集合中选取的,目标笛卡尔积为各用户特征集合对应的笛卡尔积的子集。
其中,用户特征集合,可以包括使用场景对应的集合、使用时间段对应的集合、兴趣标签对应的集合等,本申请实施例对此不做限定。实际使用时,可以根据实际需要及具体的应用场景,预先设定用户特征集合中包括的集合类型,以及各用户特征集合中包括的用户特征。比如,使用场景对应的集合可以为{社区、广告、电商},使用时间段对应的集合可以为{7天、15天、30天、90天、180天},其中,使用时间段对应的集合中的各个元素是指用户的最近使用时间与当前时刻之间的时间间隔。
在本公开实施例中,可以对各类用户特征所有可能的取值进行枚举,以生成各个用户特征集合,之后计算各个用户特征集合对应的笛卡尔积,进而按照预设的编码规则对笛卡尔积中的每个元素进行全量编码处理,以为每个元素分配一个唯一的编码并存储。并且,在进行用户账号筛选时,允许使用者从各个用户特征集合包括的所有用户特征中选取筛选目标用户账号的策略集合与兴趣标签集合。从而,在获取到筛选目标用户账号的策略集合与兴趣标签集合之后,可以直接获取策略集合与兴趣标签集合的目标笛卡尔积对应的编码,作为目标用户编码。
举例来说,用户特征集合中包括两个用户特征集合,分别为筛选策略对应的集合:{A,B,C},与兴趣标签对应的集合为{D,E},即筛选策略包含3种可能的取值,兴趣标签包含2种可能的取值,则两个用户特征集合对应的笛卡尔积为{(A,D),(A,E),(B,D),(B,E),(C,D),(C,E)},之后可以按照预设的编码规则,确定笛卡尔积中每个元素对应的编码。比如,元素(A,D)对应的编码可以为“11”,元素(A,E)对应的编码可以为“12”,元素(B,D)对应的编码可以为“21”,元素(B,E)对应的编码可以为“22”,元素(C,D)对应的编码可以为“31”,元素(C,E)对应的编码可以为“32”。若确定筛选目标用户账号的策略集合为{A},目标用户账号对应的兴趣标签集合为{E},即目标笛卡尔积为{A,E}则可以确定目标笛卡尔积对应的目标用户编码为“12”。
需要说明的是,上述举例仅为示例性的,不能视为对本公开的限制。实际使用时,可以根据实际需要及具体的应用场景确定对各用户特征集合进行编码的规则,本公开实施例对此不做限定。
在步骤104中,基于目标用户编码,查询用户编码库,以获取用户编码与目标用户编码匹配的目标用户账号,其中,用户编码库中包括用户账号与用户编码的映射关系。
在本公开实施例中,对于服务器管辖的所有用户账号,可以按照步骤102中对各用户特征集合进行编码的编码规则,对每个用户账号的画像数据进行编码,并生成用户编码库。其中,用户编码库中可以包括用户账号与用户编码的映射关系。因此,确定出筛选目标用户账号的策略集合与兴趣标签集合对应的目标用户编码之后,可以将目标用户编码与用户编码库中的所有用户编码进行匹配,并将用户编码与目标用户编码匹配的用户账号确定为目标用户账号。
需要说明的是,与目标用户编码匹配的目标用户账号可以是指对应的用户编码与目标用户编码完全相同的用户账号,也可以是指对应的用户编码中的部分序列与目标用户编码相同的用户账号。比如,目标用户编码包含两个数字,用户编码中的前两位数字与策略集合和兴趣标签集合相对应,从而可以在用户编码的前两位数字与目标用户编码相同时,确定该用户编码与目标用户编码匹配,即可以将该用户编码对应的用户账号确定为目标用户账号。从而,本公开的方案通过使用相同的编码规则对用于筛选用户账号的用户特征集合进行预先编码,以及对所有用户账号对应的画像数据进行预先编码,以使在用户账号筛选过程中可以通过简单的编码匹配,即可确定出画像数据与策略集合及兴趣标签集合匹配的目标用户账号,从而降低了用户账号筛选的数据处理量。
本公开的实施例提供的用户账号的筛选方法,通过确定用于筛选目标用户的策略集合与兴趣标签集合对应的目标笛卡尔积,并根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,确定目标笛卡尔积中每个目标元素对应的目标用户编码,其中,策略集合中的策略与兴趣标签集合中的兴趣标签是从各用户特征集合中选取的,目标笛卡尔积为各用户特征集合对应的笛卡尔积的子集,进而基于目标用户编码,查询用户编码库,以获取用户编码与目标用户编码匹配的目标用户。由此,通过预先对用户账号的兴趣点进行识别并编码存储,并将用于筛选目标用户账号的策略集合与兴趣标签集合对应的目标用户编码与用户编码库中的用户编码进行匹配,以从用户编码库中选取符合策略集合且兴趣点与兴趣标签集合相符的用户账号作为筛选出的目标用户账号,从而通过筛选条件对应的编码与用户对应的用户编码进行匹配,不仅降低了用户账号筛选的数据处理量,提升了筛选效率,而且通过编码方式存储用户的画像数据,节省了存储空间。
在本公开一种可能的实现形式中,可以向使用者提供用户账号筛选设置界面,以使使用者可以根据实际的筛选需求灵活设置策略集合和兴趣标签集合,精准定向用户群,进一步提升用户账号筛选的精准性与灵活性。
图2是根据一示例性实施例示出的另一种用户账号的筛选方法的流程图,如图2所示,该用户账号的筛选方法用于服务器中,包括以下步骤。
在步骤201中,根据用户账号筛选设置界面中的策略设置菜单与兴趣标签设置菜单中输入的目标值,确定策略集合与兴趣标签集合。
在本公开实施例中,可以向使用者提供进行用户账号筛选设置的客户端,并可以在客户端的显示界面中显示用户账号筛选设置界面,并且用户账号筛选设置界面中可以包括策略设置菜单与兴趣标签设置菜单,以使使用者在策略设置菜单中选择或输入策略集合,以及在兴趣标签设置菜单中选择或者输入兴趣标签集合。服务器可以实时获取使用者在策略设置菜单中输入的目标值,并将该目标值确定为筛选目标用户账号的策略集合,以及可以实时获取使用者在兴趣标签设置菜单中输入的目标值,并将该目标值确定为目标用户账号对应的兴趣标签集合。
作为一种可能的实现方式,筛选目标用户账号的策略集合可以包括目标用户账号在设定时段内发生交互行为的多媒体资源展示平台、目标用户账号在设定时段内发生交互行为的多媒体资源展示平台中的展示位。从而用户账号筛选设置界面的策略设置菜单中可以包括多个子菜单,以使使用者可以通过各个子菜单分别输入设定时段、多媒体资源展示平台、多媒体资源展示平台中的展示位等信息,并可以通过兴趣标签设置菜单输入兴趣标签,从而通过提供多种可选择的策略菜单,进一步提升了用户账号筛选的灵活性。
举例来说,如图3所示,为一种用户账号筛选设置界面的示意图。其中,策略设置菜单310中包括设定时段设置子菜单313、多媒体资源展示平台设置子菜单312与多媒体资源展示平台中的展示位设置子菜单311,以及行为兴趣定向子菜单314,兴趣标签设置菜单为320。假设使用者在行为兴趣定向子菜单314中输入的目标值为空,即未输入目标用户账号的行为兴趣定向,在展示位设置子菜单311中输入的目标值为“社区X”,在多媒体资源展示平台设置子菜单312中输入的目标值为“APP X”,在设定时段设置子菜单313中输入的目标值为“180”天,在兴趣标签设置菜单中输入的目标值为“教育-早教与学前教育-语言启蒙”,则服务器则可以从展示平台“APP X”的所有用户账号中,选取出近180天内在展示位“社区X”中对“教育-早教与学前教育-语言启蒙”类型的资源发生交互行为的用户账号,作为最大覆盖人群,并在最大覆盖人群中进一步筛选目标用户账号;并可以在预览框330中显示使用者选择的兴趣标签,以及最大覆盖人群对应的最大覆盖人数,以使使用者初步了解筛选出的用户规模,并可以根据实际情况调整输入的策略集合和兴趣标签集合,以使筛选的用户规模符合预期。
在步骤202中,确定与策略集合与兴趣标签集合对应的目标笛卡尔积,其中,目标笛卡尔积中包括一个或多个目标元素。
在步骤203中,根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,及目标笛卡尔积,确定每个目标元素对应的目标用户编码,其中,策略集合中的策略与兴趣标签集合中的兴趣标签是从各用户特征集合中选取的,目标笛卡尔积为各用户特征集合对应的笛卡尔积的子集。
在步骤204中,基于目标用户编码,查询用户编码库,以获取用户编码与目标用户编码匹配的目标用户账号,其中,用户编码库中包括用户账号与用户编码的映射关系。
上述步骤202-204的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
在步骤205中,确定目标用户账号的数量。
在本公开实施例中,服务器可以在确定出目标用户账号之后,统计目标用户账号的数量,以实时预估目标用户账号的数量,以使使用者可以及时了解目标用户账号的数量,以判断筛选规模是否符合预期,并在筛选规模不符合预期时,及时调整筛选策略。
在步骤206中,返回目标用户账号的数量,以在用户账号筛选设置界面中显示目标用户账号的数量。
在本公开实施例中,服务器统计出目标用户账号的数量之后,可以向使用者使用的客户端返回目标用户账号的数量,以使客户端在用户账号筛选设置界面中显示目标用户账号的数量,以实现目标用户账号数量的实时预估。比如,实时预估的目标用户账号数量可以在多媒体资源推送场景中,为使用者提供人群渗透和推送预算支持。
举例来说,如图3所示,在根据图3中所示的策略集合和兴趣标签集合筛选出目标用户账号之后,可以在人群覆盖预估显示框340内显示目标用户账号的数量。
本公开的实施例提供的用户账号的筛选方法,通过根据使用者在用户账号筛选设置界面中的策略设置菜单与兴趣标签设置菜单中输入的目标值,确定筛选目标用户的策略集合与兴趣标签集合,并确定用于筛选目标用户的策略集合与兴趣标签集合对应的目标笛卡尔积,之后根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,确定目标笛卡尔积中每个目标元素对应的目标用户编码,之后基于目标用户编码,查询用户编码库,以获取与目标用户编码匹配的目标用户账号,进而在用户账号筛选设置界面中显示目标用户账号的数量。由此,通过向使用者提供用户账号筛选设置界面,以使使用者可以根据实际的推送需求灵活设置策略集合和兴趣标签集合,精准定向用户群,从而不仅降低了用户账号筛选的数据处理量,提升了筛选效率,节省了存储空间,而且可以实时预估筛选的人群数量,为使用者提供人群渗透和推送预算支持,进一步提升了用户账号筛选的精准性与灵活性。
在本公开一种可能的实现形式中,可以通过预先训练的用户兴趣标签预测模型确定用户账号的兴趣标签,并生成与用户账号的兴趣标签和历史交互数据对应的用户编码存储至用户编码库中,从而提升了用户兴趣点识别的准确性,进而进一步提升了用户账号筛选时人群定向的精确性。
图4是根据一示例性实施例示出的再一种用户账号的筛选方法的流程图,如图4所示,该用户账号的筛选方法用于服务器中,包括以下步骤。
在步骤401中,获取筛选目标用户账号的策略集合及目标用户账号对应的兴趣标签集合。
在步骤402中,确定策略集合与兴趣标签集合对应的目标笛卡尔积,其中,目标笛卡尔积中包括一个或多个目标元素。
步骤403,根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,及目标笛卡尔积,确定每个目标元素对应的目标用户编码,其中,策略集合中的策略与兴趣标签集合中的兴趣标签是从各用户特征集合中选取的,目标笛卡尔积为各用户特征集合对应的笛卡尔积的子集。
上述步骤401-403的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
在步骤404中,获取各个参考用户账号的历史交互数据,其中,历史交互数据中包括各个交互行为所属的各个交互类型、各个交互行为对应的各个交互对象、每个交互对象对应的交互次数、及每个交互对象对应的交互时长。
其中,参考用户账号,可以是本公开实施例的用户账号的筛选方法当前对应的应用场景中的任意用户账号。比如,本公开实施例的用户账号的筛选方法应用在短视频APP中时,参考用户账号可以是该短视频APP中的任意用户账号;又如,本公开实施例的用户账号的筛选方法应用在多媒体资源推荐场景时,参考用户账号可以是待推荐的多媒体资源对应的展示平台中的任意用户账号。
其中,交互行为针对的交互对象不同,交互行为所属的交互类型也可以是不同的。可选的,交互对象包括社区直播视频、社区短视频、广告视频中的至少一种;其中,在交互对象为直播视频时,交互行为所属的交互类型可以包括观看时长、打赏、点赞、评论、转发中的至少一种;在交互对象为社区短视频时,交互行为所属的交互类型可以包括点击、播放时长、点赞、评论、转发中的至少一种;在交互对象为广告视频时,交互行为所属的交互类型可以包括点击、播放时长、表单提交、付费中的至少一种。实际使用时,可以根据实际需要及具体的应用场景确定交互类型的类型以及灵活设置针对各类交互对象的交互行为所属的交互类型,以提升用户账号筛选的适用性,本公开实施例对此不做限定。
其中,交互对象对应的交互次数,可以是指参考用户账号针对交互对象的交互行为的数量。比如,交互对象为社区短视频A,交互行为所属的交互类型包括点击、点赞、评论、转发时,参考用户账号B的历史交互数据中包括对社区短视频A点击2次、点赞1次、评论2次、转发1次,从而可以确定出社区短视频A对应的交互次数为:点击交互行为2次、点赞交互行为1次、评论交互行为2次、转发交互行为1次。
其中,交互对象对应的交互时长,可以是指参考用户账号对交互对象发生交互行为的时刻与当前时刻之间的时间间隔。需要说明的是,在本公开实施例中,还可以根据在用户账号筛选设置界面中提供的设定时段的各选项,对交互对象对应的交互时长进行归一化。比如,在用户账号筛选设置界面中提供的设定时段的选项包含7天(即发生交互行为的时间与当前时刻间的时间间隔小于或等于7天)、15天、30天、90天、180天。若用户账号B对社区短视频A的点赞交互行为与当前时刻间的时间间隔为1天,则可以将交互对象对应的交互时长归一化为7。
在本公开实施例中,可以根据预设的规则从全量用户账号中选取一部分用户作为参考用户账号,并从服务器的缓存数据中获取各个参考用户账号的历史交互数据。比如,若用户账号筛选设置界面中允许设定的最大时段为180天,则可以从全量用户账号中获取最近180天在展示平台中发生过交互行为的用户账号,作为参考用户账号。
作为一种可能的实现方式,参考用户账号的历史交互数据中还可以包括参考用户账号关注的用户账号,以及参考用户账号的终端中已安装的应用程序等数据,以从多个维度反映参考用户账号的兴趣与偏好。
在步骤405中,获取每个交互对象所属的类型。
在本公开实施例中,获取到各个参考用户账号的历史交互数据之后,可以根据交互对象所属的类型对历史交互数据中包含的所有交互对象进行分类,从而可以确定历史交互数据中每个交互对象所属的类型。
作为一种可能的实现方式,由于交互对象的标题、简介等文本信息可以反映交互对象的基本信息,从而可以根据交互对象的标题、简介等文本信息,确定交互对象所属的类型,以提升交互对象类型确定的准确性。即在本公开实施例一种可能的实现形式中,上述步骤405,可以包括:
获取每个交互对象对应的文本信息;
对每个交互对象对应的文本信息进行解析处理,以确定每个交互对象对应的商业关键词;
根据每个交互对象对应的商业关键词,确定每个交互对象所属的类型。
在本公开实施例中,可以对交互对象进行解析处理,以从交互对象中提取交互对象的标题、简介、摘要等文本信息。具体的,对于不同类型的交互对象,可以采用不同的方式提取交互对象对应的文本信息。比如,交互对象为视频时,可以提取视频标题作为交互对象对应的文本信息;也可以对视频中的每一帧图像进行文字提取,以将视频中包含的文字信息与视频标题共同作为交互对象对应的文本信息。交互对象为文本时,可以根据文本的结构,提取文本的标题、摘要等作为交互对象的文本信息。
在本公开实施例中,提取出交互对象对应的文本信息之后,可以对交互对象对应的文本信息进行分词处理,以确定文本信息中包含的各分词,进而对文本信息中包含的各分词进行词性识别、命名实体识别等自然语言处理,确定交互对象对应的商业关键词。进而根据预设的商业关键词与类型的映射关系,确定与交互对象对应的商业关键词对应的类型,并将该类型确定为交互对象所属的类型。
举例来说,交互对象为短视频,该短视频对应的标题为“XX早教课,打折促销”,则可以将该标题确定为该短视频对应的文本信息,进而对该短视频对应的文本信息进行分词处理,确定文本信息中包含的商业关键词为“早教课”,而在商业关键词与类型的映射关系中,商业关键词“早教课”对应的类型为“教育”,从而可以确定该短视频所属的类型为“教育”。
在步骤406中,根据每个交互对象所属的类型、各个交互行为所属的各个交互类型、每个交互对象的交互次数及每个交互对象对应的交互时长,确定每个参考用户账号与每类交互对象的关联度。
在本公开实施例中,由于参考用户账号对交互对象的交互类型、交互次数、交互时长等数据,可以反映出参考用户账号对交互对象的感兴趣程度,以及参考用户账号对交互对象的感兴趣程度随时间的变化趋势。从而可以根据参考用户账号的历史交互数据,确定参考用户账号对每个类交互对象的关联度。
作为一种可能的实现方式,可以首先根据参考用户账号的历史交互数据中涉及的各个交互对象所属的类型,对各个交互对象进行分类。之后,可以对参考用户账号对每个交互对象的交互行为所属的交互类型进行统计,以确定参考用户账号对每类交互对象的交互行为所属的交互类型;以及对参考用户账号对每个交互对象的交互次数进行统计,以确定参考用户账号对每类交互对象的交互次数;以及对参考用户账号对每个交互对象的交互时长进行统计,以确定参考用户账号对每类交互对象的交互时长。进而根据该参考用户账号对每类交互对象的交互类型、交互次数与交互时长,确定该参考用户账号与每类交互对象的关联度。
具体的,可以通过以下公式确定参考用户账号与每类交互对象的关联度。
其中,Ck为参考用户账号与第k类交互对象的关联度,n为参考用户账号对第k类交互对象的交互类型的数量,i为交互类型的序号,a为交互次数对应的第一权重,fi为参考用户账号对第k类交互对象发生第i个交互类型的交互行为的次数,b为交互时间对应的第二权重,ti为参考用户账号对第k类交互对象发生第i个交互类型的交互行为的最小交互时长,c为交互类型的行为权重对应的第三权重,wi为第i个交互类型的行为权重。
举例来说,参考用户账号A的历史数据中包括对教育类型的三个交互对象的交互行为,具体为:对交互对象A点赞1次,交互时长为7天内;对交互对象B转发1次,交互时长为7天内;对交互对象C评论2次,转发1次,最小交互时长为30天内;点赞对应的行为权重为w1,转发对应的行为权重为w2,评论对应的行为权重为w3;则可以确定参考用户账号A对教育行业交互对象的交互类型包括点赞、转发、评论三种,点赞交互行为的次数为1,转发交互行为的次数为2,评论交互行为的次数为2,从而可以确定参考用户账号A与教育行业交互对象的关联度为a·7b·c·w1+2a·7b·c·w2+2a·30b·c·w3。
在步骤407中,根据每个参考用户账号与每类交互对象的关联度,对每个参考用户账号对应的兴趣标签进行标注。
在本公开实施例中,由于参考用户账号与交互对象的关联度越高,说明参考用户账号对该类交互对象的感兴趣程度越高,从而在确定出每个参考用户账号与每类交互对象的关联度之后,可以利用与参考用户账号的关联度高的交互对象所属的类型,对参考用户账号对应的兴趣标签进行标注。
作为一种可能的实现方式,可以通过预设关联度阈值确定与参考对象具有高关联度的交互对象,以将与参考用户账号具有高关联度的类型确定为参考用户账号的兴趣标签,提升用户兴趣标签确定的准确性。即在本公开实施例一种可能的实现形式中,上述步骤407,可以包括:
在参考用户账号与任一类交互对象的关联度大于或等于关联度阈值时,利用任一类交互对象所属的类型对参考用户账号进行标注。
在本公开实施例中,若确定参考用户账号与任一类交互对象的关联度大于或等于关联度阈值,则可以确定参考用户账号与该类交互对象的关联度较高,即参考用户账号对该类交互对象的感兴趣程度较高,从而可以利用将该类交互对象所属的类型确定为该参考用户账号的兴趣标签。
在步骤408中,基于标注后的参考用户的历史交互数据及对应的兴趣标签,对初始标签识别模型进行训练,以生成用户兴趣标签预测模型。
在本公开实施例中,由于标注后的参考用户账号与其对应的兴趣标签具有很高的关联性,可以准确反映参考用户账号的兴趣点,从而可以使用标注后的参考用户账号的历史交互数据与对应的兴趣标签作为种子数据,对初始标签识别模型进行训练,以生成用户兴趣标签预测模型。其中,训练完成的用户兴趣标签预测模型可以根据用户账号的历史交互行为数据,准确预测用户账号的兴趣标签,从而实现了通过预测模型准确定位用户账号的兴趣点。
在步骤409中,获取候选用户账号的历史交互数据。
其中,候选用户账号,可以是每隔预设的时间间隔从全量用户中获取的用户账号。比如,本公开实施例的用户账号的筛选方法应用在多媒体信息推荐场景时,候选用户账号可以是每隔预设的时间间隔从待推送的多媒体信息展示平台中获取的用户账号。
在本公开实施例中,可以按照预设的时间间隔,从全量用户账号中获取部分用户账号,作为候选用户账号,并同时获取候选用户账号的历史交互数据。比如,预设的时间间隔可以为1天,则可以每天从全量用户账号中获取在当前时刻与上次获取时刻之间发生交互行为的用户账号,作为候选用户账号,并获取相应的历史交互数据。
需要说明的是,预设的时间间隔可以预设为较小的时间间隔,如1天、1周等,以及时获取到用户兴趣点的变化信息,实时更新用户账号的兴趣标签。
在步骤410中,利用训练生成的用户兴趣标签预测模型,对候选用户账号的历史交互数据进行处理,以预测候选用户账号对应的兴趣标签。
在本公开实施例中,获取到候选用户账号的历史交互数据之后,可以各候选用户账号的历史交互数据分别输入训练生成的用户兴趣标签预测模型,以使用户兴趣标签预测模型根据各候选用户账号的历史交互数据,确定各候选用户账号对应的兴趣标签并输出。
在步骤411中,确定候选用户账号对应的兴趣标签集合与及历史交互数据对应的集合的候选笛卡尔积,其中,候选笛卡尔积中包括一个或多个候选元素。
步骤412,根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,将与每个候选元素对应的编码确定为候选用户账号对应的用户编码。
在本公开实施例中,确定出候选用户账号对应的兴趣标签之后,可以从候选用户账号的历史交互数据抽取候选用户账号发生交互行为的展示平台、展示位、预设时段等信息,构成候选用户账号的历史交互数据对应的集合,并确定候选用户账号对应的兴趣标签集合与历史交互数据对应的集合的候选笛卡尔积,以对候选用户账号对应的兴趣标签集合与历史交互数据对应的集合进行整合,并通过候选笛卡尔积表示候选用户账号的完整特征。之后,并按照与步骤103中确定目标用户编码的方式,确定候选用户账号对应的用户编码。
在步骤413中,将候选用户账号对应的用户编码与候选用户账号的映射关系,存入用户编码库。
在本公开实施例中,确定出候选用户账号对应的用户编码之后,可以将候选用户账号对应的用户编码融入候选用户账号的画像数据,并生成候选用户账号与其对应的用户编码的对应关系存入用户编码库。从而,通过预先训练的用户兴趣标签预测模型定期生成或更新用户账号的兴趣标签,并进行编码存储,从而保证了用户编码的时效性,进一步提升了用户账号筛选的精准性。
在步骤414中,基于目标用户编码,查询用户编码库,以获取用户编码与目标用户编码匹配的目标用户账号,其中,用户编码库中包括用户账号与用户编码的映射关系。
上述步骤414的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
本公开的实施例提供的用户账号的筛选方法,通过从全量用户账号中选取与各类型的交互对象高度关联的参考用户账号作为种子用户,并利用种子用户账号的历史交互数据和兴趣标签作为训练数据训练生成用户兴趣标签预测模型,之后利用用户兴趣标签预测模型根据候选用户账号的历史交互数据,预测候选用户账号的兴趣标签,进而根据候选用户账号的兴趣标签集合与历史交互数据集合对应的候选笛卡尔积生成候选用户账号对应的用户编码,并存入用户编码库,进而根据目标用户编码与用户编码库的匹配结果确定目标用户账号。由此,通过从全量用户账号中选取参考用户账号,并利用选取的参考用户账号的历史交互数据与兴趣标签训练用户兴趣标签预测模型,以及通过用户兴趣标签预测模型确定用户账号的兴趣标签,并生成与用户账号的兴趣标签集合和历史交互数据集合对应的用户编码存储至用户编码库中,从而不仅提升了训练数据挖掘的便捷性和针对性,而且提升了用户兴趣点识别的准确性,进而进一步提升了用户账号筛选的精确性。
图5是根据一示例性实施例示出的一种用户账号的筛选装置框图。参照图5,该装置50包括第一获取模块51、第一确定模块52、第二确定模块53及、查询模块54。
该第一获取模块51,被配置为执行获取筛选目标用户账号的策略集合及目标用户账号对应的兴趣标签集合的步骤;
该第一确定模块52,被配置为执行确定与策略集合与兴趣标签集合对应的目标笛卡尔积,其中,目标笛卡尔积中包括一个或多个目标元素的步骤;
该第二确定模块53,被配置为执行根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,及目标笛卡尔积,确定每个目标元素对应的目标用户编码,其中,策略集合中的策略与兴趣标签集合中的兴趣标签是从各用户特征集合中选取的,目标笛卡尔积为各用户特征集合对应的笛卡尔积的子集的步骤;
该查询模块54,被配置为执行基于所述目标用户编码,查询用户编码库,以获取用户编码与目标用户编码匹配的目标用户账号,其中,用户编码库中包括用户账号与用户编码的映射关系的步骤。
在实际使用时,本公开实施例提供的用户账号的筛选装置,可以被配置在任意服务器中,以执行前述用户账号的筛选方法。
本公开的实施例提供的用户账号的筛选装置,通过确定用于筛选目标用户的策略集合与兴趣标签集合对应的目标笛卡尔积,并根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,确定目标笛卡尔积中每个目标元素对应的目标用户编码,其中,策略集合中的策略与兴趣标签集合中的兴趣标签是从各用户特征集合中选取的,目标笛卡尔积为各用户特征集合对应的笛卡尔积的子集,进而基于目标用户编码,查询用户编码库,以获取用户编码与目标用户编码匹配的目标用户账号。由此,通过预先对用户账号的兴趣点进行识别并编码存储,并将用于筛选目标用户账号的策略集合与兴趣标签集合对应的目标用户编码与用户编码库中的用户编码进行匹配,以从用户编码库中选取符合策略集合且兴趣点与兴趣标签集合相符的用户账号作为筛选出的目标用户账号,从而通过筛选条件对应的编码与用户对应的用户编码进行匹配,不仅降低了用户账号筛选的数据处理量,提升了筛选效率,而且通过编码方式存储用户画像数据,节省了存储空间。
在本公开一种可能的实现形式中,上述策略集合,包括以下信息中的至少一个:目标用户账号在设定时段内发生交互行为的多媒体资源展示平台、目标用户账号在设定时段内发生交互行为的多媒体资源展示平台中的展示位。
进一步的,在本公开另一种可能的实现形式中,上述用户账号的筛选装置50,还包括:
第二获取模块,被配置为执行获取候选用户账号的历史交互数据的步骤;
预测模块,被配置为执行利用训练生成的用户兴趣标签预测模型,对候选用户账号的历史交互数据进行处理,以预测候选用户账号对应的兴趣标签的步骤;
第三确定模块,被配置为执行确定候选用户账号对应的兴趣标签集合与历史交互数据对应的集合的候选笛卡尔积,其中,候选笛卡尔积中包括一个或多个候选元素的步骤;
第四确定模块,被配置为执行根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,将与每个候选元素对应的编码确定为候选用户对应的用户编码的步骤。
存储模块,被配置为执行将候选用户账号对应的用户编码与候选用户账号的映射关系,存入用户编码库的步骤。
进一步的,在本公开再一种可能的实现形式中,上述用户账号的筛选装置50,还包括:
第三获取模块,被配置为执行获取各个参考用户账号的历史交互数据的步骤,其中,历史交互数据中包括各个交互行为所属的各个交互类型、各个交互行为对应的各个交互对象、每个交互对象对应的交互次数、及每个交互对象对应的交互时长的步骤;
第四获取模块,被配置为执行获取每个交互对象所属的类型的步骤;
第五确定模块,被配置为执行根据每个交互对象所属的类型、各个交互行为所属的各个交互类型、每个交互对象的交互次数及每个交互对象对应的交互时长,确定每个参考用户账号与每类交互对象的关联度的步骤;
标注模块,被配置为执行根据每个参考用户账号与每类交互对象的关联度,对每个参考用户账号对应的兴趣标签进行标注的步骤;
训练模块,被配置为执行基于标注后的参考用户账号的历史交互数据及对应的兴趣标签,对初始标签识别模型进行训练,以生成用户兴趣标签预测模型的步骤。
进一步的,在本公开又一种可能的实现形式中,上述标注模块,包括:
标注单元,被配置为执行在参考用户账号与任一类交互对象的关联度大于或等于关联度阈值时,利用任一类交互对象所属的类型对参考用户账号进行标注的步骤。
进一步的,在本公开又一种可能的实现形式中,上述交互对象包括社区直播视频、社区短视频、广告视频中的至少一种;其中,在交互对象为直播视频时,交互行为所属的交互类型包括观看时长、打赏、点赞、评论、转发中的至少一种;在交互对象为社区短视频时,交互行为所属的交互类型包括点击、播放时长、点赞、评论、转发中的至少一种;在交互对象为广告视频时,交互行为所属的交互类型包括点击、播放时长、表单提交、付费中的至少一种。
进一步的,在本公开另一种可能的实现形式中,上述第四获取模块,包括:
获取单元,被配置为执行获取每个交互对象对应的文本信息的步骤;
第一确定单元,被配置为执行对每个交互对象对应的文本信息进行解析处理,以确定每个交互对象对应的商业关键词的步骤;
第二确定单元,被配置为执行根据每个交互对象对应的商业关键词,确定每个交互对象所属的类型的步骤。
进一步的,在本公开再一种可能的实现形式中,上述用户账号的筛选装置50,还包括:
第六确定模块,被配置为执行确定目标用户账号的数量的步骤;
返回模块,被配置为执行返回目标用户账号的数量,以在多用户账号筛选设置界面中显示所述目标用户账号的数量的步骤。
进一步的,在本公开又一种可能的实现形式中,上述用户账号筛选设置界面中包括策略设置菜单与兴趣标签设置菜单,上述第一获取模块51,包括:
第三确定单元,被配置为执行根据策略设置菜单与兴趣标签设置菜单中输入的目标值,确定策略集合与兴趣标签集合的步骤。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开的实施例提供的用户账号的筛选装置,通过从全量用户账号中选取与各类型的交互对象高度关联的参考用户账号作为种子用户,并利用种子用户账号的历史交互数据和兴趣标签作为训练数据训练生成用户兴趣标签预测模型,之后利用用户兴趣标签预测模型根据候选用户账号的历史交互数据,预测候选用户账号的兴趣标签,进而根据候选用户账号的兴趣标签集合与历史交互数据集合对应的候选笛卡尔积生成候选用户账号对应的用户编码,并存入用户编码库,进而根据目标用户编码与用户编码库的匹配结果确定目标用户账号。由此,通过从全量用户账号中选取参考用户账号,并利用选取的参考用户账号的历史交互数据与兴趣标签训练用户兴趣标签预测模型,以及通过用户兴趣标签预测模型确定用户账号的兴趣标签,并生成与用户账号的兴趣标签集合和历史交互数据集合对应的用户编码存储至用户编码库中,从而不仅提升了训练数据挖掘的便捷性和针对性,而且提升了用户兴趣点识别的准确性,进而进一步提升了用户账号筛选的精确性。
图6是根据一示例性实施例示出的一种用于多媒体资源推荐的服务器200的框图。
如图6所示,上述服务器200包括:
存储器210及处理器220,连接不同组件(包括存储器210和处理器220)的总线230,存储器210存储有计算机程序,当处理器220执行所述程序时实现本公开实施例所述的用户账号的筛选方法。
总线230表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器200典型地包括多种服务器可读介质。这些介质可以是任何能够被服务器200访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器210还可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)240和/或高速缓存存储器250。服务器200可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统260可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线230相连。存储器210可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块270的程序/实用工具280,可以存储在例如存储器210中,这样的程序模块270包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块270通常执行本公开所描述的实施例中的功能和/或方法。
服务器200也可以与一个或多个外部设备290(例如键盘、指向设备、显示器291等)通信,还可与一个或者多个使得用户能与该服务器200交互的设备通信,和/或与使得该服务器200能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口292进行。并且,服务器200还可以通过网络适配器293与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器293通过总线230与服务器200的其它模块通信。应当明白,尽管图中未示出,可以结合服务器200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器220通过运行存储在存储器210中的程序,从而执行各种功能应用以及数据处理。
需要说明的是,本实施例的服务器的实施过程和技术原理参见前述对本公开实施例的用户账号的筛选方法的解释说明,此处不再赘述。
本公开实施例提供的服务器,可以执行如前所述的用户账号的筛选方法,通过确定用于筛选目标用户账号的策略集合与兴趣标签集合对应的目标笛卡尔积,并根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,确定目标笛卡尔积中每个目标元素对应的目标用户编码,其中,策略集合中的策略与兴趣标签集合中的兴趣标签是从各用户特征集合中选取的,目标笛卡尔积为各用户特征集合对应的笛卡尔积的子集,进而基于目标用户编码,查询用户编码库,以获取用户编码与目标用户编码匹配的目标用户账号。由此,通过预先对用户账号的兴趣点进行识别并编码存储,并将用于筛选目标用户账号的策略集合与兴趣标签集合对应的目标用户编码与用户编码库中的用户编码进行匹配,以从用户编码库中选取符合策略集合且兴趣点与兴趣标签集合相符的用户账号作为筛选出的目标用户账号,从而通过筛选条件对应的编码与用户对应的用户编码进行匹配,不仅降低了用户账号筛选的数据处理量,提升了筛选效率,而且通过编码方式存储用户的画像数据,节省了存储空间。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器210,上述指令可由服务器200的处理器220执行以完成上述用户账号的筛选方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包括计算机程序/指令,当该计算机程序/指令被处理器执行时能够实现如前所述的用户账号的筛选方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种用户账号的筛选方法,其特征在于,包括:
获取筛选目标用户账号的策略集合及所述目标用户账号对应的兴趣标签集合;
确定所述策略集合与所述兴趣标签集合对应的目标笛卡尔积,其中,所述目标笛卡尔积中包括一个或多个目标元素;
根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,及所述目标笛卡尔积,确定每个所述目标元素对应的目标用户编码,其中,所述策略集合中的策略与所述兴趣标签集合中的兴趣标签是从所述各用户特征集合中选取的,所述目标笛卡尔积为所述各用户特征集合对应的笛卡尔积的子集;
基于所述目标用户编码,查询用户编码库,以获取用户编码与所述目标用户编码匹配的目标用户账号,其中,所述用户编码库中包括用户账号与用户编码的映射关系。
2.如权利要求1所述的方法,其特征在于,所述策略集合,包括以下信息中的至少一个:所述目标用户账号在设定时段内发生交互行为的多媒体资源展示平台、所述目标用户账号在设定时段内发生交互行为的多媒体资源展示平台中的展示位。
3.如权利要求1所述的方法,其特征在于,在所述基于所述目标编码,查询用户编码库之前,还包括:
获取候选用户账号的历史交互数据;
利用训练生成的用户兴趣标签预测模型,对所述候选用户账号的历史交互数据进行处理,以预测所述候选用户账号对应的兴趣标签;
确定所述候选用户账号对应的兴趣标签集合与所述历史交互数据对应的集合的候选笛卡尔积,其中,所述候选笛卡尔积中包括一个或多个候选元素;
根据所述预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,将与每个所述候选元素对应的编码确定为所述候选用户账号对应的用户编码;
将所述候选用户账号对应的用户编码与所述候选用户账号的映射关系,存入所述用户编码库。
4.如权利要求3所述的方法,其特征在于,在所述利用训练生成的用户兴趣标签预测模型,对所述候选用户账号的历史交互数据进行处理之前,还包括:
获取各个参考用户账号的历史交互数据,其中,所述历史交互数据中包括各个交互行为所属的各个交互类型、各个交互行为对应的各个交互对象、每个交互对象对应的交互次数、及每个交互对象对应的交互时长;
获取每个所述交互对象所属的类型;
根据每个所述交互对象所属的类型、各个交互行为所属的各个交互类型、每个交互对象的交互次数及每个交互对象对应的交互时长,确定每个所述参考用户账号与每类交互对象的关联度;
根据每个所述参考用户账号与每类交互对象的关联度,对每个所述参考用户账号对应的兴趣标签进行标注;
基于标注后的参考用户账号的历史交互数据及对应的兴趣标签,对初始标签识别模型进行训练,以生成所述用户兴趣标签预测模型。
5.如权利要求4所述的方法,其特征在于,所述根据每个所述参考用户账号与每类交互对象的关联度,对每个所述参考用户账号对应的兴趣标签进行标注,包括:
在所述参考用户账号与任一类交互对象的关联度大于或等于关联度阈值时,利用所述任一类交互对象所属的类型对所述参考用户账号进行标注。
6.如权利要求4所述的方法,其特征在于,所述交互对象包括社区直播视频、社区短视频、广告视频中的至少一种;其中,在所述交互对象为直播视频时,所述交互行为所属的交互类型包括观看时长、打赏、点赞、评论、转发中的至少一种;在所述交互对象为社区短视频时,所述交互行为所属的交互类型包括点击、播放时长、点赞、评论、转发中的至少一种;在所述交互对象为广告视频时,所述交互行为所属的交互类型包括点击、播放时长、表单提交、付费中的至少一种。
7.一种用户账号的筛选装置,其特征在于,包括:
第一获取模块,被配置为执行获取筛选目标用户账号的策略集合及所述目标用户账号对应的兴趣标签集合的步骤;
第一确定模块,被配置为执行确定与所述策略集合与所述兴趣标签集合对应的目标笛卡尔积,其中,所述目标笛卡尔积中包括一个或多个目标元素的步骤;
第二确定模块,被配置为执行根据预设的各用户特征集合对应的笛卡尔积中的每个元素与编码的映射关系,及所述目标笛卡尔积,确定每个所述目标元素对应的目标用户编码,其中,所述策略集合中的策略与所述兴趣标签集合中的兴趣标签是从所述各用户特征集合中选取的,所述目标笛卡尔积为所述各用户特征集合对应的笛卡尔积的子集的步骤;
查询模块,被配置为执行基于所述目标用户编码,查询用户编码库,以获取用户编码与所述目标用户编码匹配的目标用户账号,其中,所述用户编码库中包括用户账号与用户编码的映射关系的步骤。
8.一种服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1-6中任一项所述的用户账号的筛选方法。
9.一种计算机可读存储介质,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如权利要求1-6中任一项所述的用户账号的筛选方法。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1-6中任一项所述的用户账号的筛选方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110519075.0A CN115344774A (zh) | 2021-05-12 | 2021-05-12 | 用户账号的筛选方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110519075.0A CN115344774A (zh) | 2021-05-12 | 2021-05-12 | 用户账号的筛选方法、装置及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115344774A true CN115344774A (zh) | 2022-11-15 |
Family
ID=83978003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110519075.0A Pending CN115344774A (zh) | 2021-05-12 | 2021-05-12 | 用户账号的筛选方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115344774A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024061164A1 (zh) * | 2022-09-20 | 2024-03-28 | 顺丰科技有限公司 | 确定快件分拣策略的方法、装置、计算机设备及存储介质 |
-
2021
- 2021-05-12 CN CN202110519075.0A patent/CN115344774A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024061164A1 (zh) * | 2022-09-20 | 2024-03-28 | 顺丰科技有限公司 | 确定快件分拣策略的方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110941740B (zh) | 视频推荐方法及计算机可读存储介质 | |
US9824367B2 (en) | Measuring effectiveness of marketing campaigns across multiple channels | |
CN110070391B (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
EP3407285B1 (en) | Target user orientation method and device, and computer storage medium | |
CN102483745B (zh) | 共同选择图像分类 | |
CN109635155B (zh) | 为用户推送视频的方法、装置、电子设备及存储介质 | |
JP6267344B2 (ja) | 精度管理を用いたコンテンツ選択 | |
CN107193974B (zh) | 基于人工智能的地域性信息确定方法和装置 | |
CN106469202A (zh) | 一种影视大数据平台的数据分析方法 | |
CN109949089B (zh) | 一种确定展示率的方法、装置及终端 | |
US20170287023A1 (en) | Blacklisting Based on Image Feature Analysis and Collaborative Filtering | |
CN111400586A (zh) | 群组展示方法、终端、服务器、系统及存储介质 | |
CN112163614A (zh) | 一种主播分类方法、装置、电子设备及存储介质 | |
CN110704728A (zh) | 信息推荐的方法、装置、电子设备及存储介质 | |
US20240104159A1 (en) | Creating an effective product using an attribute solver | |
CN113297486B (zh) | 一种点击率预测方法及相关装置 | |
CN113722588A (zh) | 资源推荐方法、装置及电子设备 | |
CN111340605B (zh) | 训练用户行为预测模型、用户行为预测的方法和装置 | |
CN115344774A (zh) | 用户账号的筛选方法、装置及服务器 | |
US20230316106A1 (en) | Method and apparatus for training content recommendation model, device, and storage medium | |
CN112989174A (zh) | 信息推荐方法及装置、介质和设备 | |
CN111523068A (zh) | 页面配置方法、装置、服务器及存储介质 | |
CN116167803A (zh) | 一种基于信令数据的广告投放方法和装置 | |
CN111436213A (zh) | 基于情感分析选择视觉元素的系统和方法 | |
CN115809889A (zh) | 基于营销效果的智能客群筛选方法、系统、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |