CN112435070B - 确定用户年龄的方法、装置、设备及存储介质 - Google Patents

确定用户年龄的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112435070B
CN112435070B CN202011395472.3A CN202011395472A CN112435070B CN 112435070 B CN112435070 B CN 112435070B CN 202011395472 A CN202011395472 A CN 202011395472A CN 112435070 B CN112435070 B CN 112435070B
Authority
CN
China
Prior art keywords
age
user
target user
target
check
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011395472.3A
Other languages
English (en)
Other versions
CN112435070A (zh
Inventor
黄崇远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Shenzhen Huantai Technology Co Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Shenzhen Huantai Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd, Shenzhen Huantai Technology Co Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN202011395472.3A priority Critical patent/CN112435070B/zh
Publication of CN112435070A publication Critical patent/CN112435070A/zh
Application granted granted Critical
Publication of CN112435070B publication Critical patent/CN112435070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种确定用户年龄的方法、装置、设备及存储介质,属于计算机技术领域。所述方法包括:根据目标用户对推广内容项的浏览行为,生成该目标用户的推广偏好向量;根据该目标用户的属性信息生成该目标用户的属性向量;将该推广偏好向量和该属性向量输入至预先训练的年龄预测模型中,得到该年龄预测模型输出的预测结果;根据该预测结果确定该目标用户的年龄。本申请实施例提供的技术方案能够降低确定用户年龄的困难程度。

Description

确定用户年龄的方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种确定用户年龄的方法、装置、设备及存储介质。
背景技术
当前,广告等具有推广性质的内容项(可以为图像或者音视频等)在人们的日常生活中已经越来越常见了,通常情况下,广告是否能精准地投放至潜在受众用户群体中,对广告的推广效果有着重要的影响。例如,老年人用户对保健养生类产品比较感兴趣,因此,将保健养生类产品的广告投放至老年人用户中有着更好的推广效果。由于年龄是用户的一个重要属性,因此,在实际应用中,其是广告投放的重要参考指标。因此,有必要对在广告投放过程中确定用户的年龄。
相关技术中,可以采集用户的面部图像,将该面部图像输入至预先训练的图像识别模型中,就可以得到该图像识别模型输出的用户的年龄。
然而,当前,用户对隐私越来越重视,这就导致对用户面部图像的采集越来越难以得到用户的允许,从而导致利用面部图像确定用户年龄的困难程度较大。
发明内容
基于此,本申请实施例提供了一种确定用户年龄的方法、装置、设备及存储介质,可以降低确定用户年龄的困难程度。
第一方面,提供了一种确定用户年龄的方法,该方法包括:
根据目标用户对推广内容项的浏览行为,生成该目标用户的推广偏好向量;根据该目标用户的属性信息生成该目标用户的属性向量;将该推广偏好向量和该属性向量输入至预先训练的年龄预测模型中,得到该年龄预测模型输出的预测结果;根据该预测结果确定该目标用户的年龄。
第二方面,提供了一种确定用户年龄的装置,该装置包括:
第一生成模块,用于根据目标用户对推广内容项的浏览行为,生成该目标用户的推广偏好向量;
第二生成模块,用于根据该目标用户的属性信息生成该目标用户的属性向量;
获取模块,用于将该推广偏好向量和该属性向量输入至预先训练的年龄预测模型中,得到该年龄预测模型输出的预测结果;
确定模型,用于根据该预测结果确定该目标用户的年龄。
第三方面,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该计算机程序被该处理器执行时实现如上述第一方面所述的确定用户年龄的方法。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面所述的确定用户年龄的方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过根据目标用户对推广内容项的浏览行为,生成该目标用户的推广偏好向量,并根据目标用户的属性信息生成该目标用户的属性向量,而后,将目标用户的推广偏好向量和目标用户的属性向量输入至预先训练的年龄预测模型中,得到该年龄预测模型输出的预测结果,接着,根据该预测结果确定目标用户的年龄,由于用户对推广内容项的浏览行为以及用户的属性信息相较于用户的面部图像而言蕴含的隐私信息较少,因此,用户通常允许对其进行采集,故而,其获取难度相较于面部图像而言低得多,因此,基于用户对推广内容项的浏览行为以及用户的属性信息来确定用户年龄的困难程度也低得多。
附图说明
图1为本申请实施例提供的一种确定用户年龄的方法的流程图;
图2为本申请实施例提供的一种示例性地生成目标用户的推广偏好向量的技术过程的流程图;
图3为本申请实施例提供的一种CBOW实现方式的原理示意图;
图4为本申请实施例提供的一种示例性地对预测结果进行修正以及基于修正的预测结果确定目标用户所属的年龄段的技术过程的流程图;
图5为本申请实施例提供的一种确定用户年龄的装置的框图;
图6为本申请实施例提供的另一种确定用户年龄的装置的框图;
图7为本申请实施例提供的一种计算机设备的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
当前,随着互联网以及移动互联网的进一步普及,以互联网以及移动互联网作为载体的在线广告市场也在不断的扩大。
在实际应用中,能否将广告精准地投放至潜在受众用户中,对广告的推广效果有着重要的影响,而年龄作为用户的一个重要而基础的属性,是确定广告的潜在受众用户的一个十分重要的参考指标。
例如,由于中老年人更加关心保健养生,因此,保健养生类广告的潜在受众用户通常是中老年用户,由于三十岁左右的用户一般都有正在接受中小学教育的孩子,因此,中小学教育类广告的潜在受众用户通常是三十岁左右的用户,由于四十岁左右的用户通常有一定的积蓄,因此,理财类广告的潜在受众用户通常是四十岁左右的用户。
由以上说明可知,在广告投放过程中,有必要确定用户的年龄,以根据用户的年龄向用户定向投放广告。
相关技术中,可以采集用户的面部图像,并将该面部图像输入至预先训练的图像识别模型中,从而可以得到该图像识别模型输出的用户的年龄。
然而,当前,用户对隐私越来越重视,这就导致对用户面部图像的采集越来越难以得到用户的允许,因此,利用面部图像确定用户年龄的困难程度较大。
有鉴于此,本申请实施例提供了一种确定用户年龄的方法,可以降低确定用户年龄的困难程度。在本申请实施例提供的确定用户的年龄的方法中,服务器可以根据目标用户对推广内容项的浏览行为,生成该目标用户的推广偏好向量,并根据目标用户的属性信息生成该目标用户的属性向量,而后,将目标用户的推广偏好向量和目标用户的属性向量输入至预先训练的年龄预测模型中,得到该年龄预测模型输出的预测结果,接着,根据该预测结果确定目标用户的年龄,由于用户对推广内容项的浏览行为以及用户的属性信息相较于用户的面部图像而言蕴含的隐私信息较少,因此,用户通常允许对其进行采集,故而,其获取难度相较于面部图像而言低得多,因此,基于用户对推广内容项的浏览行为以及用户的属性信息来确定用户年龄的困难程度也低得多。
需要说明的是,本申请实施例提供的确定用户年龄的方法,其执行主体可以是确定用户年龄的装置,该确定用户年龄的装置可以通过软件、硬件或者软硬件结合的方式实现成为服务器的部分或者全部。下述方法实施例中,均以执行主体是服务器为例来进行说明,其中,本申请实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群。
请参考图1,其示出了本申请实施例提供的一种确定用户年龄的方法的流程图,该确定用户年龄的方法可以应用于服务器中。如图1所示,该确定用户年龄的方法可以包括以下步骤:
步骤101、服务器根据目标用户对推广内容项的浏览行为,生成目标用户的推广偏好向量。
其中,推广内容项指的是具有推广性质的内容项,所谓具有推广性质指的是具有对产品或者服务进行推广的性质,所谓内容项可以为多媒体信息,例如,该内容项可以为图像、音频、视频以及动画等等。在实际应用中,具有推广性质的内容项通常可以被通俗地称为广告、在线广告等。
目标用户对推广内容项的浏览行为指的可以是:目标用户对推广内容项的观看行为、目标用户对推广内容项的点击行为等等,本申请实施例不对该浏览行为的具体形式进行限定。
在本申请的可选实施例中,可以通过获取推广内容项的浏览日志的方式来获取目标用户对推广内容项的浏览行为。
例如,推广内容项的浏览日志可以为如下形式:
目标用户:广告a,2020年1月1日16时30分59秒
目标用户:广告b,2020年1月2日16时30分58秒
目标用户:广告a,2020年1月3日16时31分58秒
……
在获取了目标用户对推广内容项的浏览行为之后,服务器可以根据该浏览行为生成目标用户的推广偏好向量,其中,该目标用户的推广偏好向量可以包括多个向量元素,各向量元素可以为整数或者浮点数。
由于目标用户的推广偏好向量是根据目标用户对推广内容项的浏览行为生成的,因此,目标用户的推广偏好向量可以表征目标用户在推广内容项上的偏好特征。
步骤102、服务器根据目标用户的属性信息生成目标用户的属性向量。
其中,目标用户的属性信息可以包括目标用户的生理属性信息以及目标用户在目标时间段内浏览各个不同类型的内容项的浏览行为属性信息。
可选的,该生理属性信息可以包括目标用户的性别信息、目标用户的健康信息、目标用户的睡眠信息等等,本申请实施例不对生理属性信息的具体内容进行限定。
该浏览行为属性信息可以包括目标用户在目标时间段内浏览不同类型的内容项的浏览总次数,其中,目标时间段可以由技术人员进行设置,本申请实施例不对目标时间段进行具体限定。
例如,假设共有5种不同类型的内容项a,b,c,d,e,目标时间段为当前时刻之前的一个月,则该浏览行为属性信息可以包括:a:100,b:200,c:300,d:250,e:350,该浏览行为属性信息表明在当前时刻之前的一个月目标用户浏览a类型内容项的次数为100次,在当前时刻之前的一个月目标用户浏览b类型内容项的次数为200次,在当前时刻之前的一个月目标用户浏览c类型内容项的次数为300次,在当前时刻之前的一个月目标用户浏览d类型内容项的次数为250次,在当前时刻之前的一个月目标用户浏览e类型内容项的次数为450次。
可选的,服务器在获取到目标用户的生理属性信息以及浏览行为属性信息之后,可以根据该生理属性信息以及该浏览行为属性信息生成目标用户的属性向量。
可选的,服务器可以将目标用户的生理属性信息转换为数值,例如,服务器可以将男性这一性别信息转换为数值1。而后,服务器可以将生理属性信息转换后的数值与浏览行为属性信息所包括的数值进行拼接处理,从而得到目标用户的属性向量。
例如,目标用户的生理属性信息包括目标用户为男性这一性别信息,目标用户的浏览行为属性信息可以包括a:100,b:200,c:300,d:250,e:350,则目标用户的属性向量可以为[1 100 200 300 250 350]。
步骤103、服务器将目标用户的推广偏好向量和目标用户的属性向量输入至预先训练的年龄预测模型中,得到该年龄预测模型输出的预测结果。
在本申请的可选实施例中,服务器可以将目标用户的推广偏好向量以及目标用户的属性向量进行拼接处理,并将拼接处理得到的向量输入至预先训练的年龄预测模型中,从而得到该年龄预测模型输出的预测结果。
例如,目标用户的推广偏好向量可以为[0.1123 1.2232 -0.3341 4.4421 9.01986.3323 -1.3332 7.1349],目标用户的属性向量可以为[1 100 200 300 250 350],则服务器可以将这两个向量进行拼接处理,其中,拼接处理得到的向量为[1 100 200 300 250350 0.1123 1.2232 -0.3341 4.4421 9.0198 6.3323 -1.3332 7.1349],服务器可以将该拼接处理得到的向量输入至该年龄预测模型中,从而得到该年龄预测模型输出的预测结果。
在本申请的一个可选的实施例中,年龄预测模型输出的预测结果可以包括目标用户属于各个不同的年龄段的概率值。例如,假设将年龄分为了5个年龄段,该5个年龄段分别为25岁以下、25岁到35岁、35岁到45岁、45岁到55岁以及55岁以上,则该预测结果可以包括目标用户属于25岁以下年龄段的概率值、目标用户属于25岁到35岁年龄段的概率值、目标用户属于35岁到45岁年龄段的概率值、目标用户属于45岁到55岁年龄段的概率值以及目标用户属于55岁以上年龄段的概率值。
由于在实际应用中,只需要利用用户所属的年龄段这一粗粒度的年龄确定结果就可以实现广告的精准投放,因此,年龄预测模型输出的预测结果可以仅包括目标用户属于各个年龄段的概率值即可,而不需要包括目标用户处于各个具体年龄的概率值,这样,就可以大大降低年龄预测模型的运算复杂度。
在本申请的可选实施例中,该年龄预测模型可以为LR模型(逻辑回归算法模型),该LR模型可以采用下述数学语言描述:
Y=x1×w1+x2×w2+x3×w3+……+xn×wn+b。
其中,Y为LR模型输出的预测结果,在本申请实施例中,Y可以为一概率向量,该概率向量包括的向量元素为目标用户属于各个不同年龄段的概率值。
[x1 x2 x3 …… xn]为LR模型的输入向量,在本申请实施例中,其可以为上文中将目标用户的推广偏好向量和目标用户的属性向量拼接处理后得到的向量。
w1、w2、w3、……、wn为LR模型中的权值参数,b为LR模型中的偏置参数。
在本申请的可选实施例中,LR模型的softmax函数可以为:
通过该softmax函数可以将Y包括的各个概率值映射至0到1的区间内。其中,Si为Y包括的第i个概率值映射后得到的位于0到1的区间内概率值,yi为Y包括的第i个概率值,k为Y包括的概率值的个数。
在本申请的可选实施例中,可以采用有监督训练的方式对该LR模型进行训练。在对LR模型进行训练的过程中,可以获取多个训练样本,该多个训练样本包括样本用户的训练推广偏好向量、样本用户的训练属性向量以及样本用户所属的年龄段。其中,样本用户所属的年龄段指的是样本用户所属的真实年龄段,其可以作为样本标签,样本用户的训练推广偏好向量的获取方式与目标用户的推广偏好向量的获取方式同理,样本用户的训练属性向量的获取方式与目标用户的属性向量的获取方式同理,本申请实施例在此不再赘述。在获取到多个训练样本之后,可以利用该多个训练样本对LR模型进行训练。
其中,在对LR模型进行训练时所使用的损失函数可以为:
其中,H为交叉熵,p(x)为训练样本中样本用户所属年龄段的概率分布,q(x)为LR模型输出的样本用户所属年龄段的概率分布。p(x)和q(x)越接近,交叉熵越小,反之,p(x)和q(x)越不接近,交叉熵越大。
步骤104、服务器根据预测结果确定目标用户的年龄。
如上文所述,年龄预测模型输出的预测结果可以包括目标用户属于各个不同的年龄段的概率值。在本申请实施例中,服务器可以根据该概率值确定目标用户所属的年龄段,例如,服务器可以将概率值最高的年龄段作为目标用户所属的年龄段。
在本申请实施例提供的确定用户年龄的方法中,通过根据目标用户对推广内容项的浏览行为,生成该目标用户的推广偏好向量,并根据目标用户的属性信息生成该目标用户的属性向量,而后,将目标用户的推广偏好向量和目标用户的属性向量输入至预先训练的年龄预测模型中,得到该年龄预测模型输出的预测结果,接着,根据该预测结果确定目标用户的年龄,由于用户对推广内容项的浏览行为以及用户的属性信息相较于用户的面部图像而言蕴含的隐私信息较少,因此,用户通常允许对其进行采集,故而,其获取难度相较于面部图像而言低得多,因此,基于用户对推广内容项的浏览行为以及用户的属性信息来确定用户年龄的困难程度也低得多。
进一步地,本申请实施例中,除了向年龄预测模型输入目标用户的属性向量之外,还输入了目标用户的推广偏好向量,这是考虑到在实际应用中,经常会出现属性信息所蕴含的信息量不足的问题,因此,如果仅仅根据目标用户的属性向量来确定目标用户的年龄就有很大的可能出现年龄确定不准确的问题,为了避免这个问题,本申请实施例增加了目标用户的推广偏好向量,从而丰富了年龄预测模型的输入,因此,可以提高确定的年龄的准确性。
除此以外,由于目标用户的推广偏好向量可以表征目标用户在推广内容项上的偏好特征,因此,利用目标用户的推广偏好向量确定的目标用户的年龄更加能够适应推广内容项的投放,也即是,广告的投放,使得投放的效果更加精准。
在本申请的一个可选实施例中,提供了一种示例性地生成目标用户的推广偏好向量的技术过程,请参考图2,其示出了该技术过程的流程图,如图2所示,该技术过程包括以下步骤:
步骤201、服务器根据目标用户以及除目标用户以外的其他用户对多个不同的推广内容项的浏览行为,生成与该多个不同的推广内容项一一对应的多个内容项浏览序列。
如上文所述,目标用户对多个不同的推广内容项的浏览行为可以通过获取浏览日志的方式来获取,同理地,其他用户对多个不同的推广内容项的浏览行为也可以通过获取浏览日志的方式来获取。
在获取到目标用户以及其他用户对多个不同的推广内容项的浏览行为之后,服务器可以按照推广内容项为聚合维度,对目标用户以及其他用户对多个不同的推广内容项的浏览行为进行聚合处理,从而得到与多个不同的推广内容项一一对应的多个内容项浏览序列。
其中,各内容项浏览序列包括按照预设排列方式排列的浏览对应的推广内容项的各用户的用户标识。例如,假设用户A、用户B、用户C以及目标用户均浏览了推广内容项X,则与推广内容项X对应的内容项浏览序列就可以包括按照预设排列顺序排列的用户A的用户标识、用户B的用户标识、用户C的用户标识以及目标用户的用户标识。可选的,该预设排列方式可以为按照浏览时间先后顺序进行排列的方式。
例如,假设用户A、用户B、用户C以及目标用户浏览推广内容项X的时间先后顺序为用户B、用户C、用户A以及目标用户,则与推广内容项X对应的内容项浏览序列就可以包括用户B的用户标识、用户C的用户标识、用户A的用户标识以及目标用户的用户标识。
在本申请的可选实施例中,用户标识可以为IMEI等用于唯一标识用户的标识信息。
步骤202、服务器将多个内容项浏览序列输入至预先训练的向量生成模型中,得到该向量生成模型输出的目标用户的推广偏好向量。
在本申请的可选实施例中,该向量生成模型可以为Word2vec模型,其中,Word2vec模型是一种可以非常好地根据序列得到表征主体的向量的模型,常用于NLP领域,其原本的作用是根据句子生成词向量。
在本申请实施例中,可以采用Word2vec模型生成推广偏好向量,其中,可以将内容项浏览序列看成是一个句子,内容项浏览序列中的用户标识看成是句子中的词语,Word2vec模型可以以输出词向量的方式输出内容项浏览序列中各用户标识对应的向量,该向量即为本申请实施例所述的推广偏好向量,通过这样的方式,即可得到目标用户的推广偏好向量。
实际应用中,Word2vec模型有两种实现方式,一种是Continuous Bag-of-Words(CBOW)实现方式,另外一种是Skip-gram实现方式,本申请实施例主要使用CBOW实现方式进行推广偏好向量的计算。
请参考图3,其为CBOW实现方式的原理示意图,如图3所示,在CBOW实现方式中,可以将句子中某个词(也就是内容项浏览序列中的某一个用户标识)的前c个词(用户标识)以及后c个词(用户标识)输入至Word2vec模型中,从而可以得到该某个词(用户标识)的词向量(也即是推广偏好向量)。
在本申请的可选实施例中,可以使用无监督训练的方式对Word2vec模型进行训练,其中,训练的样本可以为样本内容项浏览序列,训练时所使用的目标函数可以为:
其中,T为样本内容项浏览序列的长度,也即是,T为样本内容项浏览序列包括的用户标识的个数,wt为样本内容项浏览序列中的第t个用户标识,wt-c为样本内容项浏览序列中第t个用户标识的前c个用户标识,wt+c为样本内容项浏览序列中第t个用户标识的后c个用户标识,P(wt|wt-c:wt+c)可以根据下述公式得到:
其中,为样本内容项浏览序列中的第t个用户标识的推广偏好向量,vn为样本内容项浏览序列中的第n个用户标识的推广偏好向量,/>可以根据下述公式得到:
为/>的矩阵转置运算。
在实际应用中,用户年龄确定错误会对广告投放业务产生较大的损失,其中,确定的用户年龄与实际的用户年龄差距越大,产生的损失也就越大。因此,为了避免给广告投放业务带来损失,有必要采取一定的措施来提高用户年龄确定的准确性。
通常情况下,年龄预测模型输出的预测结果并不是百分之百准确的,其总会存在一些误差,例如,年龄预测模型输出的预测结果中25岁到35岁年龄段对应的概率值最大,为0.99,而用户实际年龄却为25岁以下,这就说明年龄预测模型输出的预测结果出现了误差。
为了保证用户年龄确定的准确性,有必要对年龄预测模型的输出误差进行评估,并根据评估对年龄预测模型输出的预测结果进行修正。
请参考图4,其示出了对预测结果进行修正以及基于修正的预测结果确定目标用户所属的年龄段的技术过程,如图4所示,该技术过程可以包括以下步骤:
步骤401、服务器获取各个年龄段分别对应的概率修正系数。
其中,各个年龄段对应的概率修正系数是根据年龄预测模型对各个年龄段的预测准确程度得到的,该概率系数为小于等于1的正数。
在本申请的可选实施例中,各个年龄段对应的概率修正系数与年龄预测模型对各个年龄段的预测准确程度正相关,也即是,年龄预测模型对某个年龄段的预测准确程度越高,该年龄段对应的概率修正系数越大,反之,年龄预测模型对某个年龄段的预测准确程度越低,该年龄段对应的概率修正系数越小。
在本申请的可选实施例中,可以预先计算各个年龄段所分别对应的概率修正系数,并将计算得到的各个年龄段所分别对应的概率修正系数存储至服务器中,在步骤401中,服务器可以从本地存储中获取该各个年龄段所分别对应的概率修正系数。
下面,本申请实施例将对各个年龄段对应的概率修正系数的计算过程进行简要的说明。
步骤A1、获取多个校验样本。
其中,各校验样本包括样本用户的校验推广偏好向量、样本用户的校验属性向量以及样本用户所属的年龄段。
样本用户所属的年龄段指的是样本用户所属的真实年龄段,其可以作为样本标签,样本用户的校验推广偏好向量的获取方式与目标用户的推广偏好向量的获取方式同理,样本用户的校验属性向量的获取方式与目标用户的属性向量的获取方式同理,本申请实施例在此不再赘述。
步骤A2、将各个校验样本中的校验推广偏好向量以及校验属性向量输入至年龄预测模型中,得到年龄预测模型输出的各个校验样本对应的校验预测结果。
在步骤A2中,对于每个校验样本而言,可以将该检验样本中的校验推广偏好向量以及校验属性向量输入至年龄预测模型中,得到年龄预测模型输出的与该校验样本对应的校验预测结果。
步骤A3、根据各个校验样本对应的校验预测结果,从多个校验样本中筛选目标校验样本,目标校验样本对应的校验预测结果与目标校验样本中的年龄段不相符。
其中,目标校验样本对应的校验预测结果与目标校验样本中的年龄段不相符指的是:目标校验样本对应的校验预测结果中最大概率值对应的年龄段与目标校验样本中不相同。
例如,某一检验样本对应的校验预测结果中最大概率值对应的年龄段为小于25岁的年龄段,而该校验样本中样本用户所属的年龄段为25岁到35岁的年龄段,则该校验样本就可以被筛选为目标校验样本。
步骤A4、根据目标校验样本生成各个年龄段分别对应的概率修正系数。
可选的,在本申请实施例中,对于各个目标校验样本,可以获取该目标校验样本对应的校验预测结果所指示的年龄段与目标校验样本中的年龄段的差距,并根据差距计算与该目标校验样本中的年龄段对应的单次概率修正系数。
在一种可能的实现方式中,计算目标校验样本中的年龄段对应的单次概率修正系数的公式可以为:
δ=1-k×b。
其中,为目标校验样本中的年龄段对应的单次概率修正系数,k为常数,其取值可以为0.2,b为目标校验样本对应的校验预测结果所指示的年龄段与目标校验样本中的年龄段的差距,该差距可以使用年龄段距离表征。
其中,在本申请实施例中,可以将各个年龄段按照年龄由小至大的顺序进行排序,得到年龄段序列,年龄段距离指的可以是两个年龄段在该年龄段序列中的排序值的差值,在本申请实施例中,年龄段距离为正整数。
例如,假设将年龄分为了5个年龄段,该5个年龄段分别为25岁以下、25岁到35岁、35岁到45岁、45岁到55岁以及55岁以上,则年龄段序列就可以为25岁以下、25岁到35岁、35岁到45岁、45岁到55岁、55岁以上,则25岁以下(在年龄段序列中的排序值为1)这一年龄段和35岁到45岁(在年龄段序列中的排序值为3)这一年龄段的年龄段距离就为2。
在对于每一个目标校验样本均计算得到该目标校验样本中的年龄段对应的单次概率修正系数之后,可以计算各个年龄段对应的多个单次概率修正系数的平均值,并将该平均值作为各个年龄段对应的概率修正系数。
步骤402、对于各个年龄段,服务器将该年龄段对应的概率修正系数与年龄预测模型输出的预测结果中该年龄段对应的概率值相乘,得到该年龄段对应的修正概率值。
例如,在年龄预测模型输出的预测结果中,目标用户属于25岁以下年龄段的概率值为0.5,目标用户属于25岁到35岁年龄段的概率值为0.6,目标用户属于35岁到45岁年龄段的概率值为0.7,目标用户属于45岁到55岁年龄段的概率值为0.8,目标用户属于55岁以上年龄段的概率值为0.9。同时,25岁以下、25岁到35岁、35岁到45岁、45岁到55岁以及55岁以上则5个年龄段分别对应的概率修正系数为0.9、0.8、0.8、0.7以及0.7。
则25岁以下年龄段对应的修正概率值可以为0.5*0.9=0.45,25岁到35岁年龄段对应的修正概率值可以为0.6*0.8=0.48,35岁到45岁年龄段对应的修正概率值可以为0.7*0.8=0.56,45岁到55岁年龄段对应的修正概率值可以为0.8*0.7=0.56,55岁以上年龄段对应的修正概率值可以为0.9*0.7=0.63。
步骤403、服务器根据各个年龄段对应的修正概率值,确定目标用户所属的年龄段。
在本申请的可选实施例中,服务器可以将修正概率值最高的年龄段作为目标用户所属的年龄段。
请参考图5,其示出了本申请实施例提供的一种确定用户年龄的装置500的框图,该确定用户年龄的装置500可以配置于服务器中。如图5所示,该确定用户年龄的装置500可以包括:第一生成模块501、第二生成模块502、获取模块503以及确定模块504。
其中,该第一生成模块501,用于根据目标用户对推广内容项的浏览行为,生成该目标用户的推广偏好向量。
该第二生成模块502,用于根据该目标用户的属性信息生成该目标用户的属性向量。
该获取模块503,用于将该推广偏好向量和该属性向量输入至预先训练的年龄预测模型中,得到该年龄预测模型输出的预测结果。
该确定模块504,用于根据该预测结果确定该目标用户的年龄。
在其中一个实施例中,该第一生成模块501,具体用于:根据该目标用户以及除该目标用户以外的其他用户对多个不同的推广内容项的浏览行为,生成与该多个不同的推广内容项一一对应的多个内容项浏览序列,其中,各内容项浏览序列包括按照预设排列方式排列的浏览对应的推广内容项的各用户的用户标识;将该多个内容项浏览序列输入至预先训练的向量生成模型中,得到该向量生成模型输出的该推广偏好向量。
在其中一个实施例中,该预设排列方式为按照浏览时间先后顺序进行排列的方式。
在其中一个实施例中,该第二生成模块502,具体用于:获取该目标用户的生理属性信息;获取该目标用户在目标时间段内浏览各个不同类型的内容项的浏览行为属性信息;根据该生理属性信息和该浏览行为属性信息生成该属性向量。
在其中一个实施例中,该预测结果包括该目标用户属于各个年龄段的概率值;该确定模块504,具体用于:获取各个年龄段分别对应的概率修正系数,各个年龄段对应的概率修正系数是根据该年龄预测模型对各个年龄段的预测准确程度得到的,该概率系数为小于等于1的正数;对于各个年龄段,将该年龄段对应的概率修正系数与该年龄段对应的概率值相乘,得到该年龄段对应的修正概率值;根据各个年龄段对应的修正概率值,确定该目标用户所属的年龄段。
请参考图6,本申请实施例还提供了另一种确定用户年龄的装置600,该确定用户年龄的装置600除了包括确定用户年龄的装置500包括的各个模块外,可选的,该确定用户年龄的装置600还包括系数生成模块505。
该系数生成模块505,用于:获取多个校验样本,其中,各校验样本包括样本用户的校验推广偏好向量、样本用户的校验属性向量以及样本用户所属的年龄段;将各个校验样本中的校验推广偏好向量以及校验属性向量输入至该年龄预测模型中,得到该年龄预测模型输出的各个校验样本对应的校验预测结果;根据各个校验样本对应的校验预测结果,从该多个校验样本中筛选目标校验样本,该目标校验样本对应的校验预测结果与该目标校验样本中的年龄段不相符;根据该目标校验样本生成各个年龄段分别对应的概率修正系数。
在其中一个实施例中,该系数生成模块505,具体用于:对于各个目标校验样本,获取该目标校验样本对应的校验预测结果所指示的年龄段与该目标校验样本中的年龄段的差距,并根据该差距计算与该目标校验样本中的年龄段对应的单次概率修正系数;将各个年龄段对应的多个单次概率修正系数的平均值作为各个年龄段对应的概率修正系数。
本申请实施例提供的确定用户年龄的装置,可以实现上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
关于确定用户年龄的装置的具体限定可以参见上文中对于确定用户年龄的方法的限定,在此不再赘述。上述确定用户年龄的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图7为一个实施例中计算机设备的内部结构示意图,该计算机设备可以为服务器。如图7所示,该计算机设备包括通过系统总线连接的处理器以及存储器。其中,该处理器用于提供计算和控制能力,支撑整个计算机设备的运行。存储器可包括非易失性存储介质及内存储器。非易失性存储介质存储有操作系统和计算机程序。该计算机程序可被处理器所执行,以用于实现以上各个实施例所提供的一种确定用户年龄的方法。内存储器为非易失性存储介质中的操作系统以及计算机程序提供高速缓存的运行环境。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本申请的一个实施例中,提供了一种计算机设备,该计算机设备可以为服务,该计算机设备包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
根据目标用户对推广内容项的浏览行为,生成该目标用户的推广偏好向量;根据该目标用户的属性信息生成该目标用户的属性向量;将该推广偏好向量和该属性向量输入至预先训练的年龄预测模型中,得到该年龄预测模型输出的预测结果;根据该预测结果确定该目标用户的年龄。
在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:根据该目标用户以及除该目标用户以外的其他用户对多个不同的推广内容项的浏览行为,生成与该多个不同的推广内容项一一对应的多个内容项浏览序列,其中,各内容项浏览序列包括按照预设排列方式排列的浏览对应的推广内容项的各用户的用户标识;将该多个内容项浏览序列输入至预先训练的向量生成模型中,得到该向量生成模型输出的该推广偏好向量。
在本申请的一个实施例中,该预设排列方式为按照浏览时间先后顺序进行排列的方式。
在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:获取该目标用户的生理属性信息;获取该目标用户在目标时间段内浏览各个不同类型的内容项的浏览行为属性信息;根据该生理属性信息和该浏览行为属性信息生成该属性向量。
在本申请的一个实施例中,该预测结果包括该目标用户属于各个年龄段的概率值;处理器执行计算机程序时还实现以下步骤:获取各个年龄段分别对应的概率修正系数,各个年龄段对应的概率修正系数是根据该年龄预测模型对各个年龄段的预测准确程度得到的,该概率系数为小于等于1的正数;对于各个年龄段,将该年龄段对应的概率修正系数与该年龄段对应的概率值相乘,得到该年龄段对应的修正概率值;根据各个年龄段对应的修正概率值,确定该目标用户所属的年龄段。
在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:获取多个校验样本,其中,各校验样本包括样本用户的校验推广偏好向量、样本用户的校验属性向量以及样本用户所属的年龄段;将各个校验样本中的校验推广偏好向量以及校验属性向量输入至该年龄预测模型中,得到该年龄预测模型输出的各个校验样本对应的校验预测结果;根据各个校验样本对应的校验预测结果,从该多个校验样本中筛选目标校验样本,该目标校验样本对应的校验预测结果与该目标校验样本中的年龄段不相符;根据该目标校验样本生成各个年龄段分别对应的概率修正系数。
在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:对于各个目标校验样本,获取该目标校验样本对应的校验预测结果所指示的年龄段与该目标校验样本中的年龄段的差距,并根据该差距计算与该目标校验样本中的年龄段对应的单次概率修正系数;将各个年龄段对应的多个单次概率修正系数的平均值作为各个年龄段对应的概率修正系数。
本申请实施例提供的计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在本申请的一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
根据目标用户对推广内容项的浏览行为,生成该目标用户的推广偏好向量;根据该目标用户的属性信息生成该目标用户的属性向量;将该推广偏好向量和该属性向量输入至预先训练的年龄预测模型中,得到该年龄预测模型输出的预测结果;根据该预测结果确定该目标用户的年龄。
在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据该目标用户以及除该目标用户以外的其他用户对多个不同的推广内容项的浏览行为,生成与该多个不同的推广内容项一一对应的多个内容项浏览序列,其中,各内容项浏览序列包括按照预设排列方式排列的浏览对应的推广内容项的各用户的用户标识;将该多个内容项浏览序列输入至预先训练的向量生成模型中,得到该向量生成模型输出的该推广偏好向量。
在本申请的一个实施例中,该预设排列方式为按照浏览时间先后顺序进行排列的方式。
在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取该目标用户的生理属性信息;获取该目标用户在目标时间段内浏览各个不同类型的内容项的浏览行为属性信息;根据该生理属性信息和该浏览行为属性信息生成该属性向量。
在本申请的一个实施例中,该预测结果包括该目标用户属于各个年龄段的概率值;计算机程序被处理器执行时还实现以下步骤:获取各个年龄段分别对应的概率修正系数,各个年龄段对应的概率修正系数是根据该年龄预测模型对各个年龄段的预测准确程度得到的,该概率系数为小于等于1的正数;对于各个年龄段,将该年龄段对应的概率修正系数与该年龄段对应的概率值相乘,得到该年龄段对应的修正概率值;根据各个年龄段对应的修正概率值,确定该目标用户所属的年龄段。
在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取多个校验样本,其中,各校验样本包括样本用户的校验推广偏好向量、样本用户的校验属性向量以及样本用户所属的年龄段;将各个校验样本中的校验推广偏好向量以及校验属性向量输入至该年龄预测模型中,得到该年龄预测模型输出的各个校验样本对应的校验预测结果;根据各个校验样本对应的校验预测结果,从该多个校验样本中筛选目标校验样本,该目标校验样本对应的校验预测结果与该目标校验样本中的年龄段不相符;根据该目标校验样本生成各个年龄段分别对应的概率修正系数。
在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:对于各个目标校验样本,获取该目标校验样本对应的校验预测结果所指示的年龄段与该目标校验样本中的年龄段的差距,并根据该差距计算与该目标校验样本中的年龄段对应的单次概率修正系数;将各个年龄段对应的多个单次概率修正系数的平均值作为各个年龄段对应的概率修正系数。
本实施例提供的计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以M种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(SyMchliMk)DRAM(SLDRAM)、存储器总线(RaMbus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种确定用户年龄的方法,其特征在于,所述方法包括:
根据目标用户对推广内容项的浏览行为,生成所述目标用户的推广偏好向量;
根据所述目标用户的属性信息生成所述目标用户的属性向量;
将所述推广偏好向量和所述属性向量输入至预先训练的年龄预测模型中,得到所述年龄预测模型输出的预测结果,所述预测结果包括所述目标用户属于各个年龄段的概率值;
获取多个校验样本,其中,各所述校验样本包括样本用户的校验推广偏好向量、样本用户的校验属性向量以及样本用户所属的年龄段;将各个所述校验样本中的校验推广偏好向量以及校验属性向量输入至所述年龄预测模型中,得到所述年龄预测模型输出的各个所述校验样本对应的校验预测结果;根据各个所述校验样本对应的校验预测结果,从所述多个校验样本中筛选目标校验样本,所述目标校验样本对应的校验预测结果与所述目标校验样本中的年龄段不相符;对于各个所述目标校验样本,获取所述目标校验样本对应的校验预测结果所指示的年龄段与所述目标校验样本中的年龄段的差距,并根据所述差距计算与所述目标校验样本中的年龄段对应的单次概率修正系数;将各个年龄段对应的多个单次概率修正系数的平均值作为各个年龄段对应的概率修正系数,所述概率系数为小于等于1的正数;
对于各个年龄段,将所述年龄段对应的概率修正系数与所述年龄段对应的概率值相乘,得到所述年龄段对应的修正概率值;
根据各个年龄段对应的修正概率值,确定所述目标用户所属的年龄段。
2.根据权利要求1所述的方法,其特征在于,所述根据目标用户对推广内容项的浏览行为,生成所述目标用户的推广偏好向量,包括:
根据所述目标用户以及除所述目标用户以外的其他用户对多个不同的推广内容项的浏览行为,生成与所述多个不同的推广内容项一一对应的多个内容项浏览序列,其中,各所述内容项浏览序列包括按照预设排列方式排列的浏览对应的推广内容项的各用户的用户标识;
将所述多个内容项浏览序列输入至预先训练的向量生成模型中,得到所述向量生成模型输出的所述推广偏好向量。
3.根据权利要求2所述的方法,其特征在于,所述预设排列方式为按照浏览时间先后顺序进行排列的方式。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户的属性信息生成所述目标用户的属性向量,包括:
获取所述目标用户的生理属性信息;
获取所述目标用户在目标时间段内浏览各个不同类型的内容项的浏览行为属性信息;
根据所述生理属性信息和所述浏览行为属性信息生成所述属性向量。
5.根据权利要求1所述的方法,其特征在于,所述属性信息包括所述目标用户的生理属性信息以及所述目标用户在目标时间段内浏览各个不同类型的内容项的浏览行为属性信息。
6.根据权利要求1所述的方法,其特征在于,所述浏览行为包括所述目标用户对所述推广内容项的观看行为和点击行为。
7.根据权利要求2所述的方法,其特征在于,所述向量生成模型为Word2vec模型。
8.一种确定用户年龄的装置,其特征在于,所述装置包括:
第一生成模块,用于根据目标用户对推广内容项的浏览行为,生成所述目标用户的推广偏好向量;
第二生成模块,用于根据所述目标用户的属性信息生成所述目标用户的属性向量;
获取模块,用于将所述推广偏好向量和所述属性向量输入至预先训练的年龄预测模型中,得到所述年龄预测模型输出的预测结果,所述预测结果包括所述目标用户属于各个年龄段的概率值;
确定模型,用于获取多个校验样本,其中,各所述校验样本包括样本用户的校验推广偏好向量、样本用户的校验属性向量以及样本用户所属的年龄段;将各个所述校验样本中的校验推广偏好向量以及校验属性向量输入至所述年龄预测模型中,得到所述年龄预测模型输出的各个所述校验样本对应的校验预测结果;根据各个所述校验样本对应的校验预测结果,从所述多个校验样本中筛选目标校验样本,所述目标校验样本对应的校验预测结果与所述目标校验样本中的年龄段不相符;对于各个所述目标校验样本,获取所述目标校验样本对应的校验预测结果所指示的年龄段与所述目标校验样本中的年龄段的差距,并根据所述差距计算与所述目标校验样本中的年龄段对应的单次概率修正系数;将各个年龄段对应的多个单次概率修正系数的平均值作为各个年龄段对应的概率修正系数,所述概率系数为小于等于1的正数;对于各个年龄段,将所述年龄段对应的概率修正系数与所述年龄段对应的概率值相乘,得到所述年龄段对应的修正概率值;根据各个年龄段对应的修正概率值,确定所述目标用户所属的年龄段。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7任一所述的确定用户年龄的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一所述的确定用户年龄的方法。
CN202011395472.3A 2020-12-03 2020-12-03 确定用户年龄的方法、装置、设备及存储介质 Active CN112435070B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011395472.3A CN112435070B (zh) 2020-12-03 2020-12-03 确定用户年龄的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011395472.3A CN112435070B (zh) 2020-12-03 2020-12-03 确定用户年龄的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112435070A CN112435070A (zh) 2021-03-02
CN112435070B true CN112435070B (zh) 2024-03-19

Family

ID=74691149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011395472.3A Active CN112435070B (zh) 2020-12-03 2020-12-03 确定用户年龄的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112435070B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113456031A (zh) * 2021-08-09 2021-10-01 首都医科大学附属北京天坛医院 一种脑状态预测模型的训练装置、预测装置及电子设备
CN113505891A (zh) * 2021-09-09 2021-10-15 北京轻松筹信息技术有限公司 年龄信息的确定方法及装置、信息推送方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110310155A (zh) * 2019-06-28 2019-10-08 河北工业职业技术学院 广告投放方法、装置及服务器

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110310155A (zh) * 2019-06-28 2019-10-08 河北工业职业技术学院 广告投放方法、装置及服务器

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
应用商城中用户年龄的推断及在推荐中的应用;李佳琪等;《计算机科学与探索》;第12卷(第11期);第1732、1736-1737页 *
融合用户特征与偏好的个性化微博推荐;黄贤英等;信息技术与信息化;第56-61页 *
黄贤英 ; 鲁燃 ; 王智昊 ; .融合用户特征与偏好的个性化微博推荐.信息技术与信息化.2018,(第Z1期), *

Also Published As

Publication number Publication date
CN112435070A (zh) 2021-03-02

Similar Documents

Publication Publication Date Title
US20210056458A1 (en) Predicting a persona class based on overlap-agnostic machine learning models for distributing persona-based digital content
US11188950B2 (en) Audience expansion for online social network content
CN109783730A (zh) 产品推荐方法、装置、计算机设备和存储介质
US8965828B2 (en) Inferring user mood based on user and group characteristic data
US8370330B2 (en) Predicting content and context performance based on performance history of users
JP7160980B2 (ja) 情報提供装置、情報提供方法、およびプログラム
US20170011420A1 (en) Methods and apparatus to analyze and adjust age demographic information
CN110223186B (zh) 用户相似度确定方法以及信息推荐方法
WO2018149337A1 (zh) 一种信息投放方法、装置及服务器
CN112435070B (zh) 确定用户年龄的方法、装置、设备及存储介质
CN107463580B (zh) 训练点击率预估模型方法和装置、点击率预估方法和装置
CN108491511A (zh) 基于图数据的数据挖掘方法和装置、模型训练方法和装置
CN109246450B (zh) 一种基于隐式信息评分的影视择优推荐方法
TW201843622A (zh) 基於資料源的業務客製裝置、方法及電腦可讀儲存介質
CN110363580B (zh) 信息推荐方法、装置、计算机设备及存储介质
JP6576067B2 (ja) 情報処理装置、情報処理プログラムおよび情報処理方法
CN109801101A (zh) 标签确定方法、装置、计算机设备和存储介质
US11971872B2 (en) Generating user attribute verification scores to facilitate improved data validation from scaled data providers
CN113343091A (zh) 面向产业和企业的科技服务推荐计算方法、介质及程序
CN112839063A (zh) 消息推送方法、消息显示方法、存储介质和计算机设备
CN114461871A (zh) 推荐模型训练方法、对象推荐方法、装置及存储介质
CN113343024B (zh) 对象推荐方法、装置、电子设备及存储介质
CN113850416A (zh) 广告推广合作对象确定方法和装置
CN111260416B (zh) 用于确定对象的关联用户的方法及装置
CN114600125A (zh) 相同组内跨异类子组的鲁棒模型性能

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant