CN109993588A - 一种用户年龄预测的方法及装置 - Google Patents
一种用户年龄预测的方法及装置 Download PDFInfo
- Publication number
- CN109993588A CN109993588A CN201910286279.7A CN201910286279A CN109993588A CN 109993588 A CN109993588 A CN 109993588A CN 201910286279 A CN201910286279 A CN 201910286279A CN 109993588 A CN109993588 A CN 109993588A
- Authority
- CN
- China
- Prior art keywords
- age
- user
- predicted
- interactive information
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种用户年龄预测的方法及装置,包括获取待预测用户在社交平台的互动信息,其中,所述互动信息用于描述所述待预测用户与所述社交平台其余用户的关联关系;基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率;基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间。通过这种方法,可以实现对社交平台上不包含年龄信息的用户的年龄区间的预测,进而方便商家针对不同年龄层的用户进行需求分析,增强社交平台对用户的管理。
Description
技术领域
本申请涉及信息处理技术领域,具体而言,涉及一种用户年龄预测的方法及装置。
背景技术
商家在社交平台投放广告时需要考虑到社交平台的用户的年龄层,针对各个年龄层的用户,进行需求分析,调整投放计划。
现有技术中,在获取社交平台用户年龄时,主要通过获取用户在社交平台注册时的信息的方法,然而当用户在社交平台注册若并未提交年龄信息时,将无法针对这部分用户进行需求分析。
发明内容
有鉴于此,本申请的目的在于提供一种用户年龄预测的方法及装置,以实现对用户年龄的预测。
第一方面,本申请实施例提供了一种用户年龄预测的方法,包括:
获取待预测用户在社交平台的互动信息,其中,所述互动信息用于描述所述待预测用户与所述社交平台其余用户的关联关系;
基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率;
基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,在获取待预测用户在社交平台的互动信息之前,所述方法还包括:
确定所述社交平台上的每一个用户的关联用户的数量;
从所述社交平台的用户中筛选出关联用户的数量超过预设值的用户,并将筛选出的用户确定为选定用户;
所述获取待预测用户在社交平台的互动信息,包括:
获取所述待预测用户与所述选定用户的互动信息。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率,包括:
基于所述互动信息,确定所述待预测用户的稀疏矩阵,所述稀疏矩阵用于描述所述待预测用户与所述选定用户之间的关联关系;
将所述稀疏矩阵输入至预先训练好的年龄预测模型中,输出得到所述待预测用户属于每一个预设年龄区间的概率。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间,包括:
选择概率最大的预设年龄区间作为所述待预测用户的年龄落入的目标年龄区间。
结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,按照以下方法训练得到所述年龄预测模型:
获取样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息;
基于所述样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息,对待训练的年龄预测模型进行训练,其中训练过程包括:
将每一个样本用户所对应的互动信息输入至待训练的年龄预测模型中,输出所述每一个样本用户属于每一个预设年龄区间的概率;
基于所述年龄预测模型输出的所述每一个样本用户属于每一个预测年龄区间的概率,确定所述样本用户的年龄区间;
基于确定出的每一个样本用户的年龄区间,以及每一个样本用户在社交平台注册时所提交的年龄信息,确定本次训练的准确率;
当确定出的本次训练的准确率不满足预设条件时,调整所述年龄预测模型的模型参数,并重复执行上述训练过程,直至确定出的准确率满足预设条件。
第二方面,本申请实施例还提供一种用户年龄预测的装置,包括:
获取模块,用于获取待预测用户在社交平台的互动信息,其中,所述互动信息用于描述所述待预测用户与所述社交平台其余用户的关联关系;
第一确定模块,用于基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率;
第二确定模块,用于基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,所述装置,还包括:
筛选模块,用于在获取待预测用户在社交平台的互动信息之前,确定所述社交平台上的每一个用户的关联用户的数量,并从所述社交平台的用户中筛选出关联用户的数量超过预设值的用户,并将筛选出的用户确定为选定用户;
所述获取模块,在获取待预测用户在社交平台的互动信息时,具体用于:
获取所述待预测用户与所述选定用户的互动信息。
结合第二方面的第一种可能的实施方式,本申请实施例提供了第二方面的第二种可能的实施方式,其中,所述第一确定模块,在基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率时,具体用于:
基于所述互动信息,确定所述待预测用户的稀疏矩阵,所述稀疏矩阵用于描述所述待预测用户与所述选定用户之间的关联关系;
将所述稀疏矩阵输入至预先训练好的年龄预测模型中,输出得到所述待预测用户属于每一个预设年龄区间的概率。
结合第二方面,本申请实施例提供了第二方面的第三种可能的实施方式,其中,所述第二确定模块,在基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间时,具体用于:
选择概率最大的预设年龄区间作为所述待预测用户的年龄落入的目标年龄区间。
结合第二方面,本申请实施例提供了第二方面的第四种可能的实施方式,其中,所述装置,还包括:
训练模块,用于按照以下方法训练得到所述年龄预测模型:
获取样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息;
基于所述样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息,对待训练的年龄预测模型进行训练,其中训练过程包括:
将每一个样本用户所对应的互动信息输入至待训练的年龄预测模型中,输出所述每一个样本用户属于每一个预设年龄区间的概率;
基于所述年龄预测模型输出的所述每一个样本用户属于每一个预测年龄区间的概率,确定所述样本用户的年龄区间;
基于确定出的每一个样本用户的年龄区间,以及每一个样本用户在社交平台注册时所提交的年龄信息,确定本次训练的准确率;
当确定出的本次训练的准确率不满足预设条件时,调整所述年龄预测模型的模型参数,并重复执行上述训练过程,直至确定出的准确率满足预设条件。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面的任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面的任一种可能的实施方式中的步骤。
本申请实施例提供的年龄预测的方法,通过获取的待预测用户在社交平台的互动信息以及预先训练好的年龄预测模型对待预测用户的年龄区间进行预测,通过这种方法,可以实现对社交平台上不包含年龄信息的用户的年龄区间的预测,进而方便商家针对不同年龄层的用户进行需求分析,增强社交平台对用户的管理。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种用户年龄预测的方法的流程示意图;
图2示出了本申请实施例所提供的一种年龄预测模型训练方法的流程示意图;
图3示出了本申请实施例所提供的一种用户年龄预测的装置300的架构示意图;
图4示出了本申请实施例所提供的电子设备400的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
考虑到社交平台上可能并不包含所有用户的年龄信息,这种情况一方面不利于社交平台对用户进行管理,一方面不利于对社交平台用户的分析,基于此,本申请实施例提供了一种用户年龄预测的方法及装置,下面通过实施例进行描述。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种年龄预测的方法进行详细介绍。
实施例一
参见图1所示,为本申请实施例所提供的一种用户年龄预测的方法的流程示意图,包括以下步骤:
S101、获取待预测用户在社交平台的互动信息。
在一种可能的实施方式中,互动信息用于描述待预测用户与社交平台其余用户的关联关系,获取的待预测用户在社交平台的互动信息可以是获取待预测用户与社交平台其余用户的关联关系。
考虑到社交平台的用户较多,若获取待预测用户与社交平台所有的其余用户的关联关系,所需数据可能较多,因此,在另一种可能的实施方式中,获取待预测用户在社交平台的互动信息可以是获取的待预测用户与社交平台影响程度较大的用户的关联关系。
具体的,可以先确定社交平台上每一个用户的关联用户的数量,然后从社交平台的用户中筛选出关联用户的数量超过预设值的用户,并将筛选出的用户确定为选定用户,在获取待预测用户在社交平台的互动信息时,可以是获取待预测用户与选定用户的互动信息。
示例性地,若社交平台为微博,则选定用户可以是微博粉丝数超过预设粉丝数的用户,互动信息可以是待预测用户所关注的选定用户以及待预测用户在微博发文时所提及的选定用户。
S102、基于互动信息,以及预先训练好的年龄预测模型,确定待预测用户的年龄落入每一个预设年龄区间的概率。
具体实施时,可以先基于互动信息,确定待预测用户的稀疏矩阵,其中,稀疏矩阵用于描述待预测用户与选定用户之间的关联关系,然后将确定出的稀疏矩阵输入至预先训练好的年龄预测模型中,并输出得到待预测用户属于每一个预设年龄区间的概率。
示例性的,选定用户可以用关键意见领袖(Key opinion leader,KOL)表示,因为选定用户的个数不止一个,因此可以用KOL1,KOL2,…,KOLn表示。一种可能的稀疏矩阵的确定方法,可以参照表1所示:
表1
KOL | KOL1 | KOL2 | KOL3 | KOL4 | KOL5 | … | KOLn-1 | KOLn |
A | 1 | 0 | 1 | 0 | 1 | … | 1 | 0 |
首先,可以根据用户A所关注的KOL情况,确定稀疏矩阵。用户A关注KOL1,KOL3,KOL5,…,KOLn-1,则在相应的位置上添加1。
然后根据用户A发文所提及的KOL情况,调整稀疏矩阵,例如在微博上发文@KOL1,则在KOL1所对应的位置上加上取值1,以此类推,直至最终确定出用户A所对应的稀疏矩阵。
需要说明的是,在确定稀疏矩阵时,用户所关注的KOL情况,以及根据用户发文所提及的KOL情况所需权重可以根据实际情况进行调整,即用户A关注KOL1时,在相应位置上所添加的取值数可以不一定是1,根据用户A所提及的KOL情况,调整稀疏矩阵时所调整的取值数也可以不一定为1。
示例性的,在确定用户B的系数矩阵时,可以参照表2所示:
表2
KOL | KOL1 | KOL2 | KOL3 | KOL4 | KOL5 | … | KOLn-1 | KOLn |
A | 2 | 0 | 1 | 0 | 1 | … | 1 | 0 |
B | 1 | 1 | 1 | 1 | 0 | … | 0 | 1 |
首先,根据用户B关注的KOL情况,确定稀疏矩阵,然后根据用户B的发文情况,对稀疏矩阵进行调整。
通过上述方法可以确定出用户A的稀疏矩阵为[2,0,1,0,1,…,1,0],用户B的稀疏矩阵为[1,1,1,1,0,…,0,1],然后基于确定出的稀疏矩阵以及预先训练好的年龄预测模型,对待预测用户A和待预测用户B分别属于每一个预设年龄区间的概率。
一种可能的应用场景中,年龄预测模型可以是softmax逻辑回归模型,或者其他分类模型,对此本申请并不进行限定。
S103、基于待预测用户的年龄落入每一个预设年龄区间的概率,确定待预测用户的年龄落入的目标年龄区间。
实际应用中,可以选择概率最大的预设年龄区间作为待预测用户的年龄落入的目标年龄区间。
示例性的,预设年龄区间可以是间隔5年的区间,如预设年龄区间可以包括10岁以下,10-15岁,15-20岁,20-25岁,25-30岁,30岁以上等区间,然后当根据待预测用户的稀疏矩阵,确定待预测用户的年龄落入每一个预设年龄区间的概率。
在一种可能的应用场景中,用户在社交平台进行注册时,社交平台允许用户不提交年龄信息,但是可以给用户提供标签供用户选择,例如微博标签,若用户选择了年龄标签,例如年龄标签可以为“90后”,则在通过年龄预测模型预测出待预测用户的年龄中筛选出与标签相一致的年龄区间,并从筛选出的年龄区间中选择概率最大的年龄区间作为目标年龄区间。
本实施例还提供了一种年龄预测模型训练方法,参见图2所示,为本申请实施例提供的一种年龄预测模型训练方法的流程示意图,包括以下步骤:
S201、获取样本用户在社交平台注册时所提交的年龄信息,以及样本用户在社交平台的互动信息。
S202、基于样本用户在社交平台注册时所提交的年龄信息,以及样本用户在社交平台的互动信息,对待训练的年龄预测模型进行训练,其中训练过程包括:
S2021、将每一个样本用户所对应的互动信息输入至待训练的年龄预测模型中,输出每一个样本用户属于每一个预设年龄区间的概率;
S2022、基于年龄预测模型输出的每一个样本用户属于每一个预测年龄区间的概率,确定样本用户的年龄区间;
S2023、基于确定出的每一个样本用户的年龄区间,以及每一个样本用户在社交平台注册时所提交的年龄信息,确定本次训练的准确率;
S2024、判断本次训练的准确率是否满足预设条件。
其中,判断本次训练的准确率是否满足预设条件可以是判断本次训练的准确率是否在预设准确率范围之内,若判断结果为是,则执行步骤S2025;若判断结果为否,则执行步骤S2026。
S2025、确定年龄预测模型训练完成。
S2026、调整年龄预测模型的模型参数,并返回执行步骤S2021。
本实施例提供的用户年龄预测的方法,首先获取待预测用户在社交平台的互动信息,然后基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率;再基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间。通过这种方法,可以实现对社交平台上不包含年龄信息的用户的年龄区间的预测,进而方便商家针对不同年龄层的用户进行需求分析,增强社交平台对用户的管理。
实施例二
参见图3所示,为本申请实施例提供的一种用户年龄预测的装置300的架构示意图,包括获取模块301、第一确定模块302、第二确定模块303、筛选模块304、以及训练模块305,具体的:
获取模块301,用于获取待预测用户在社交平台的互动信息,其中,所述互动信息用于描述所述待预测用户与所述社交平台其余用户的关联关系;
第一确定模块302,用于基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率;
第二确定模块303,用于基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间。
一种可能的设计中,筛选模块304,用于在获取待预测用户在社交平台的互动信息之前,确定所述社交平台上的每一个用户的关联用户的数量,并从所述社交平台的用户中筛选出关联用户的数量超过预设值的用户,并将筛选出的用户确定为选定用户;
所述获取模块301,在获取待预测用户在社交平台的互动信息时,具体用于:
获取所述待预测用户与所述选定用户的互动信息。
一种可能的设计中,所述第一确定模块302,在基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率时,具体用于:
基于所述互动信息,确定所述待预测用户的稀疏矩阵,所述稀疏矩阵用于描述所述待预测用户与所述选定用户之间的关联关系;
将所述稀疏矩阵输入至预先训练好的年龄预测模型中,输出得到所述待预测用户属于每一个预设年龄区间的概率。
一种可能的设计中,所述第二确定模块303,在基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间时,具体用于:
选择概率最大的预设年龄区间作为所述待预测用户的年龄落入的目标年龄区间。
一种可能的设计中,所述装置,还包括:
训练模块305,用于按照以下方法训练得到所述年龄预测模型:
获取样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息;
基于所述样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息,对待训练的年龄预测模型进行训练,其中训练过程包括:
将每一个样本用户所对应的互动信息输入至待训练的年龄预测模型中,输出所述每一个样本用户属于每一个预设年龄区间的概率;
基于所述年龄预测模型输出的所述每一个样本用户属于每一个预测年龄区间的概率,确定所述样本用户的年龄区间;
基于确定出的每一个样本用户的年龄区间,以及每一个样本用户在社交平台注册时所提交的年龄信息,确定本次训练的准确率;
当确定出的本次训练的准确率不满足预设条件时,调整所述年龄预测模型的模型参数,并重复执行上述训练过程,直至确定出的准确率满足预设条件。
本申请实施例提供的年龄预测的装置,通过获取的待预测用户在社交平台的互动信息以及预先训练好的年龄预测模型对待预测用户的年龄区间进行预测,通过这种方法,可以实现对社交平台上不包含年龄信息的用户的年龄区间的预测,进而方便商家针对不同年龄层的用户进行需求分析,提高社交平台对用户的管理。
实施例三
基于同一技术构思,本申请实施例还提供了一种电子设备。参照图4所示,为本申请实施例提供的电子设备400的结构示意图,包括处理器401、存储器402、和总线403。其中,存储器402用于存储执行指令,包括内存4021和外部存储器4022;这里的内存4021也称内存储器,用于暂时存放处理器401中的运算数据,以及与硬盘等外部存储器4022交换的数据,处理器401通过内存4021与外部存储器4022进行数据交换,当电子设备400运行时,处理器401与存储器402之间通过总线403通信,使得处理器401在执行以下指令:
获取待预测用户在社交平台的互动信息,其中,所述互动信息用于描述所述待预测用户与所述社交平台其余用户的关联关系;
基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率;
基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间。
一种可能的设计中,处理器401执行的处理中,在获取待预测用户在社交平台的互动信息之前,所述方法还包括:
确定所述社交平台上的每一个用户的关联用户的数量;
从所述社交平台的用户中筛选出关联用户的数量超过预设值的用户,并将筛选出的用户确定为选定用户;
所述获取待预测用户在社交平台的互动信息,包括:
获取所述待预测用户与所述选定用户的互动信息。
一种可能的设计中,处理器401执行的处理中,所述基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率,包括:
基于所述互动信息,确定所述待预测用户的稀疏矩阵,所述稀疏矩阵用于描述所述待预测用户与所述选定用户之间的关联关系;
将所述稀疏矩阵输入至预先训练好的年龄预测模型中,输出得到所述待预测用户属于每一个预设年龄区间的概率。
一种可能的设计中,处理器401执行的处理中,所述基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间,包括:
选择概率最大的预设年龄区间作为所述待预测用户的年龄落入的目标年龄区间。
一种可能的设计中,处理器401执行的处理中,按照以下方法训练得到所述年龄预测模型:
获取样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息;
基于所述样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息,对待训练的年龄预测模型进行训练,其中训练过程包括:
将每一个样本用户所对应的互动信息输入至待训练的年龄预测模型中,输出所述每一个样本用户属于每一个预设年龄区间的概率;
基于所述年龄预测模型输出的所述每一个样本用户属于每一个预测年龄区间的概率,确定所述样本用户的年龄区间;
基于确定出的每一个样本用户的年龄区间,以及每一个样本用户在社交平台注册时所提交的年龄信息,确定本次训练的准确率;
当确定出的本次训练的准确率不满足预设条件时,调整所述年龄预测模型的模型参数,并重复执行上述训练过程,直至确定出的准确率满足预设条件。
实施例四
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述任一实施例中所述的用户年龄预测的方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述用户年龄预测的方法的步骤,从而实现对社交平台上不包含年龄信息的用户的年龄区间的预测。
本申请实施例所提供的进行用户年龄预测的方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (12)
1.一种用户年龄预测的方法,其特征在于,包括:
获取待预测用户在社交平台的互动信息,其中,所述互动信息用于描述所述待预测用户与所述社交平台其余用户的关联关系;
基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率;
基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间。
2.根据权利要求1所述的方法,其特征在于,在获取待预测用户在社交平台的互动信息之前,所述方法还包括:
确定所述社交平台上的每一个用户的关联用户的数量;
从所述社交平台的用户中筛选出关联用户的数量超过预设值的用户,并将筛选出的用户确定为选定用户;
所述获取待预测用户在社交平台的互动信息,包括:
获取所述待预测用户与所述选定用户的互动信息。
3.根据权利要求2所述的方法,其特征在于,所述基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率,包括:
基于所述互动信息,确定所述待预测用户的稀疏矩阵,所述稀疏矩阵用于描述所述待预测用户与所述选定用户之间的关联关系;
将所述稀疏矩阵输入至预先训练好的年龄预测模型中,输出得到所述待预测用户属于每一个预设年龄区间的概率。
4.根据权利要求1所述的方法,其特征在于,所述基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间,包括:
选择概率最大的预设年龄区间作为所述待预测用户的年龄落入的目标年龄区间。
5.根据权利要求1所述的方法,其特征在于,按照以下方法训练得到所述年龄预测模型:
获取样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息;
基于所述样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息,对待训练的年龄预测模型进行训练,其中训练过程包括:
将每一个样本用户所对应的互动信息输入至待训练的年龄预测模型中,输出所述每一个样本用户属于每一个预设年龄区间的概率;
基于所述年龄预测模型输出的所述每一个样本用户属于每一个预测年龄区间的概率,确定所述样本用户的年龄区间;
基于确定出的每一个样本用户的年龄区间,以及每一个样本用户在社交平台注册时所提交的年龄信息,确定本次训练的准确率;
当确定出的本次训练的准确率不满足预设条件时,调整所述年龄预测模型的模型参数,并重复执行上述训练过程,直至确定出的准确率满足预设条件。
6.一种用户年龄预测的装置,其特征在于,包括:
获取模块,用于获取待预测用户在社交平台的互动信息,其中,所述互动信息用于描述所述待预测用户与所述社交平台其余用户的关联关系;
第一确定模块,用于基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率;
第二确定模块,用于基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间。
7.根据权利要求6所述的装置,其特征在于,所述装置,还包括:
筛选模块,用于在获取待预测用户在社交平台的互动信息之前,确定所述社交平台上的每一个用户的关联用户的数量,并从所述社交平台的用户中筛选出关联用户的数量超过预设值的用户,并将筛选出的用户确定为选定用户;
所述获取模块,在获取待预测用户在社交平台的互动信息时,具体用于:
获取所述待预测用户与所述选定用户的互动信息。
8.根据权利要求7所述的装置,其特征在于,所述第一确定模块,在基于所述互动信息,以及预先训练好的年龄预测模型,确定所述待预测用户的年龄落入每一个预设年龄区间的概率时,具体用于:
基于所述互动信息,确定所述待预测用户的稀疏矩阵,所述稀疏矩阵用于描述所述待预测用户与所述选定用户之间的关联关系;
将所述稀疏矩阵输入至预先训练好的年龄预测模型中,输出得到所述待预测用户属于每一个预设年龄区间的概率。
9.根据权利要求6所述的装置,其特征在于,所述第二确定模块,在基于所述待预测用户的年龄落入每一个预设年龄区间的概率,确定所述待预测用户的年龄落入的目标年龄区间时,具体用于:
选择概率最大的预设年龄区间作为所述待预测用户的年龄落入的目标年龄区间。
10.根据权利要求6所述的装置,其特征在于,所述装置,还包括:
训练模块,用于按照以下方法训练得到所述年龄预测模型:
获取样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息;
基于所述样本用户在社交平台注册时所提交的年龄信息,以及样本用户在所述社交平台的互动信息,对待训练的年龄预测模型进行训练,其中训练过程包括:
将每一个样本用户所对应的互动信息输入至待训练的年龄预测模型中,输出所述每一个样本用户属于每一个预设年龄区间的概率;
基于所述年龄预测模型输出的所述每一个样本用户属于每一个预测年龄区间的概率,确定所述样本用户的年龄区间;
基于确定出的每一个样本用户的年龄区间,以及每一个样本用户在社交平台注册时所提交的年龄信息,确定本次训练的准确率;
当确定出的本次训练的准确率不满足预设条件时,调整所述年龄预测模型的模型参数,并重复执行上述训练过程,直至确定出的准确率满足预设条件。
11.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至5任一所述的用户年龄预测的方法的步骤。
12.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至5任一所述的用户年龄预测的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910286279.7A CN109993588A (zh) | 2019-04-10 | 2019-04-10 | 一种用户年龄预测的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910286279.7A CN109993588A (zh) | 2019-04-10 | 2019-04-10 | 一种用户年龄预测的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109993588A true CN109993588A (zh) | 2019-07-09 |
Family
ID=67133037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910286279.7A Pending CN109993588A (zh) | 2019-04-10 | 2019-04-10 | 一种用户年龄预测的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109993588A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110781436A (zh) * | 2019-10-28 | 2020-02-11 | 时趣互动(北京)科技有限公司 | 年龄标注方法及系统 |
CN110827064A (zh) * | 2019-10-22 | 2020-02-21 | 时趣互动(北京)科技有限公司 | 一种基于社交媒体平台数据的用户年龄标注方法 |
CN113505891A (zh) * | 2021-09-09 | 2021-10-15 | 北京轻松筹信息技术有限公司 | 年龄信息的确定方法及装置、信息推送方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070073568A1 (en) * | 2005-09-28 | 2007-03-29 | Hideki Kobayashi | Method and apparatus to predict activity |
US20130110481A1 (en) * | 2011-11-02 | 2013-05-02 | ThinkVine Corporation | Agent Generation for Agent-Based Modeling Systems |
CN108335131A (zh) * | 2018-01-19 | 2018-07-27 | 北京奇艺世纪科技有限公司 | 一种预估用户年龄段的方法、装置及电子设备 |
-
2019
- 2019-04-10 CN CN201910286279.7A patent/CN109993588A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070073568A1 (en) * | 2005-09-28 | 2007-03-29 | Hideki Kobayashi | Method and apparatus to predict activity |
US20130110481A1 (en) * | 2011-11-02 | 2013-05-02 | ThinkVine Corporation | Agent Generation for Agent-Based Modeling Systems |
CN108335131A (zh) * | 2018-01-19 | 2018-07-27 | 北京奇艺世纪科技有限公司 | 一种预估用户年龄段的方法、装置及电子设备 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827064A (zh) * | 2019-10-22 | 2020-02-21 | 时趣互动(北京)科技有限公司 | 一种基于社交媒体平台数据的用户年龄标注方法 |
CN110781436A (zh) * | 2019-10-28 | 2020-02-11 | 时趣互动(北京)科技有限公司 | 年龄标注方法及系统 |
CN113505891A (zh) * | 2021-09-09 | 2021-10-15 | 北京轻松筹信息技术有限公司 | 年龄信息的确定方法及装置、信息推送方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111507768B (zh) | 一种潜在用户的确定方法及相关装置 | |
CN108171280A (zh) | 一种分类器构建方法及预测分类的方法 | |
CN108492194A (zh) | 产品推荐方法、装置及存储介质 | |
CN109388675A (zh) | 数据分析方法、装置、计算机设备及存储介质 | |
CN109993588A (zh) | 一种用户年龄预测的方法及装置 | |
CN109190754A (zh) | 量化模型生成方法、装置和电子设备 | |
CN109190808A (zh) | 用户行为预测方法、装置、设备及介质 | |
WO2019179030A1 (zh) | 产品购买预测方法、服务器及存储介质 | |
CN112801718A (zh) | 用户行为预测方法、装置、设备及介质 | |
CN114663198A (zh) | 基于用户画像的产品推荐方法、装置、设备及存储介质 | |
CN110298508A (zh) | 行为预测方法、装置及设备 | |
CN107437111A (zh) | 基于神经网络的数据处理方法、介质、装置和计算设备 | |
CN112465141A (zh) | 模型压缩方法、装置、电子设备及介质 | |
CN109214772A (zh) | 项目推荐方法、装置、计算机设备及存储介质 | |
CN112070310A (zh) | 基于人工智能的流失用户预测方法、装置及电子设备 | |
CN108280759A (zh) | 风控模型优化方法、终端及计算机可读存储介质 | |
CN110162609A (zh) | 用于向用户推荐咨询问题的方法及装置 | |
CN114355793B (zh) | 用于车辆仿真评测的自动驾驶规划模型的训练方法及装置 | |
CN110334720A (zh) | 业务数据的特征提取方法、装置、服务器和存储介质 | |
CN111159241A (zh) | 一种点击转化预估方法及装置 | |
CN111652282B (zh) | 基于大数据的用户偏好分析方法、装置及电子设备 | |
CN112700006A (zh) | 网络架构搜索方法、装置、电子设备及介质 | |
Cang et al. | Feature ranking and best feature subset using mutual information | |
CN108288172A (zh) | 广告dsp定向投放广告的方法及终端 | |
KR102010031B1 (ko) | 게임 지표 정보 예측 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190709 |
|
RJ01 | Rejection of invention patent application after publication |