CN102708497B - 一种基于VideoBag特征的精准广告投放系统及方法 - Google Patents

一种基于VideoBag特征的精准广告投放系统及方法 Download PDF

Info

Publication number
CN102708497B
CN102708497B CN201210009483.2A CN201210009483A CN102708497B CN 102708497 B CN102708497 B CN 102708497B CN 201210009483 A CN201210009483 A CN 201210009483A CN 102708497 B CN102708497 B CN 102708497B
Authority
CN
China
Prior art keywords
user
age
sex
module
video frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210009483.2A
Other languages
English (en)
Other versions
CN102708497A (zh
Inventor
王晓龙
姚键
尹玉宗
卢学裕
严金龙
潘柏宇
卢述奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Youku Network Technology Beijing Co Ltd
Original Assignee
1Verge Internet Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 1Verge Internet Technology Beijing Co Ltd filed Critical 1Verge Internet Technology Beijing Co Ltd
Priority to CN201210009483.2A priority Critical patent/CN102708497B/zh
Publication of CN102708497A publication Critical patent/CN102708497A/zh
Application granted granted Critical
Publication of CN102708497B publication Critical patent/CN102708497B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于互联网技术领域,特别涉及一种广告投放系统及方法。其技术方案是:一种基于VideoBag特征的精准广告投放系统,包括以下模块:用户数据采集模块(1),视频节目鉴别能力计算和排序模块(2),VideoBag打包模块(3),权重计算模块(4),用户特征表生成模块(5),用户性别分类模型训练模块(6),用户年龄段分类模型训练模块(7),用户性别与年龄段预测模块(8),广告投放模块(9),它根据某广告投放的目标人群,向具有适合性别、年龄段标签的用户投放该广告。本发明直接利用用户的观看行为对目标受众进行高精度的性别、年龄的分类,在较大程度上提升了广告到达目标受众的精确度,从而有效地提升了广告效果。

Description

一种基于VideoBag特征的精准广告投放系统及方法
技术领域
本发明属于互联网技术领域,特别涉及一种广告投放系统及方法。
背景技术
广告投放是互联网最常用的信息传播模式之一。对于视频网站,目前最主要的广告投放方式还是基于内容定向、时间定向和频道定向的,以上的广告投放方式最大的缺点是目标受众到达率低。
发明内容
本发明的目的是:提供一种针对目标受众投放广告,从而有效提升广告效果的系统和方法。
本发明的技术方案是:一种基于VideoBag特征的精准广告投放系统,它包括:用户数据采集模块,视频节目鉴别能力计算和排序模块,VideoBag打包模块,权重计算模块,用户特征表生成模块,用户性别分类模型训练模块,用户年龄段分类模型训练模块,用户性别与年龄段预测模块,广告投放模块;
所述用户数据采集模块获取用户视频节目观看日志,并通过网上投递的调查问卷,收集用户性别、年龄信息;
所述视频节目鉴别能力计算和排序模块利用所述用户数据采集模块收集的用户性别、年龄信息,计算各视频节目的性别鉴别能力I1和年龄鉴别能力I2
I1=(man_view-woman_view)/(man_view+woman_view)
I2=(in_group_view-not_in_group_view)/(in_group_view+not_in_group_view)
式中:man_view为该视频节目被男性观看的次数,woman_view为被女性观看的数次;in_group_view为该视频节目被属于年龄段[min_age,max_age]用户的观看次数,not_in_group_view为不属于年龄段[min_age,max_age]用户的观看次数;
将所有视频节目分别按I1、I2值大小进行两个排序,分别称为I1排序和I2排序;在每个排序中为每个视频节目赋予相应ID编号;
所述VideoBag打包模块将所述视频节目鉴别能力计算和排序模块给出的I1排序和I2排序,分别依序每m个视频节目打包在一起得到一个VideoBag,最后一个VideoBag中视频节目不足m个则按实际数量;从1开始,为每个VideoBag赋予一个编号,从而得到分别对应I1排序和I2排序的两个VideoBag序列;
所述权重计算模块计算各个VideoBag中所有视频节目的I1或I2绝对值的平均值;并令其为本VideoBag的权重Weight;
所述用户特征表生成模块从所述用户数据采集模块获取的用户视频节目观看日志,将每个用户在一段时间内观看的所有视频节目列表,将该表中的每一视频节目在I1排序和I2排序中的ID编号转换成所在VideoBag的编号和权重Weight,得到每个用户的特征列表;
由于观看次数过少的样本数据噪声较大,故剔除观看视频节目次数少于k次的用户样本;
设得到UserNum个已知性别、所属年龄段的用户特征列表;将这UserNum个用户特征列表分为两部分,一部分用于训练,另一部分由于用户测试;
所述用户性别分类模型训练模块使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成模块提供的一部分用户特征列表,将其中男性用户作为正样本、女性用户作为反样本进行训练,并以所述用户特征表生成模块提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为性别模型;
所述用户年龄段分类模型训练模块使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成模块提供的一部分用户特征列表,将其中年龄属于要求年龄段[min_age,max_age]的用户作为正样本、其他年龄段的用户作为反样本进行训练,并以所述用户特征表生成模块提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为年龄段模型;
所述用户性别与年龄段预测模块对所述用户数据采集模块获取的性别、年龄段未知的用户,依据其视频节目观看日志,使用所述性别模型预测其性别,使用所述年龄段模型预测其年龄段,得到对该用户性别与年龄段的预测结果;基于预测结果,对该用户赋予性别、年龄段标签;
所述广告投放模块根据所述用户性别与年龄段预测模块给出的用户性别、年龄段标签,按照某广告投放的目标人群,向具有适合性别、年龄段的用户投放该广告。
一种基于VideoBag特征的精准广告投放方法,它依序执行以下步骤:
A.用户数据采集步骤,它获取用户视频节目观看日志,并通过网上投递的调查问卷,收集用户性别、年龄信息;
B.视频节目鉴别能力计算和排序步骤,它利用所述用户数据采集步骤收集的用户性别、年龄信息,计算各视频节目的性别鉴别能力I1和年龄鉴别能力I2
I1=(man_view-woman_view)/(man_view+woman_view)
I2=(in_group_view-not_in_group_view)/(in_group_view+not_in_group_view)式中:man_view为该视频节目被男性观看的次数,woman_view为被女性观看的数次;in_group_view为该视频节目被属于年龄段[min_age,max_age]用户的观看次数,not_in_group_view为不属于年龄段[min_age,max_age]用户的观看次数;
将所有视频节目分别按I1、I2值大小进行两个排序,分别称为I1排序和I2排序;在每个排序中为每个视频节目赋予相应ID编号;
C.VideoBag打包步骤,它将所述视频节目鉴别能力计算和排序步骤给出的I1排序和I2排序,分别依序每m个视频节目打包在一起得到一个VideoBag,最后一个VideoBag中视频节目不足m个则按实际数量;从1开始,为每个VideoBag赋予一个编号,从而得到分别对应I1排序和I2排序的两个VideoBag序列;
D.权重计算步骤,它计算各个VideoBag中所有视频节目的I1或I2绝对值的平均值;并令其为本VideoBag的权重Weight;
E.用户特征表生成步骤,它从所述用户数据采集步骤获取的用户视频节目观看日志,将每个用户在一段时间内观看的所有视频节目列表,将该表中的每一视频节目在I1排序和I2排序中的ID编号转换成所在VideoBag的编号和权重Weight,得到每个用户的特征列表;
由于观看次数过少的样本数据噪声较大,故剔除观看视频节目次数少于k次的用户样本;
设得到UserNum个已知性别、所属年龄段的用户特征列表;将这UserNum个用户特征列表分为两部分,一部分用于训练,另一部分用于用户测试;
F.用户性别分类模型训练步骤,它使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成步骤提供的一部分用户特征列表,将其中男性用户作为正样本、女性用户作为反样本进行训练,并以所述用户特征表生成步骤提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为性别模型;
G.用户年龄段分类模型训练步骤,它使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成步骤提供的一部分用户特征列表,将其中年龄属于要求年龄段[min_age,max_age]的用户作为正样本、其他年龄段的用户作为反样本进行训练,并以所述用户特征表生成步骤提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为年龄段模型;
H.用户性别与年龄段预测步骤,它对所述用户数据采集步骤获取的性别、年龄段未知的用户,依据其视频节目观看日志,使用所述性别模型预测其性别,使用所述年龄段模型预测其年龄段,得到对该用户性别与年龄段的预测结果;基于预测结果,对该用户赋予性别、年龄段标签;
I.广告投放步骤,它根据所述用户性别与年龄段预测步骤给出的用户性别、年龄段标签,按照某广告投放的目标人群,向具有适合性别、年龄段的用户投放该广告。
本发明直接利用用户的观看行为对目标受众进行高精度的性别、年龄的分类,在较大程度上提升了广告到达目标受众的精确度,从而有效地提升了广告效果。
附图说明
附图为本发明中一种基于VideoBag特征的精准广告投放系统的结构框图。
具体实施方式
实施例1:参见附图,一种基于VideoBag特征的精准广告投放系统,它包括:用户数据采集模块1,视频节目鉴别能力计算和排序模块2,VideoBag打包模块3,权重计算模块4,用户特征表生成模块5,用户性别分类模型训练模块6,用户年龄段分类模型训练模块7,用户性别与年龄段预测模块8,广告投放模块9;
所述用户数据采集模块1获取用户视频节目观看日志,并通过网上投递的调查问卷,收集用户性别、年龄信息;
所述视频节目鉴别能力计算和排序模块2利用所述用户数据采集模块1收集的用户性别、年龄信息,计算各视频节目的性别鉴别能力I1和年龄鉴别能力I2
I1=(man_view-woman_view)/(man_view+woman_view)
I2=(in_group_view-not_in_group_view)/(in_group_view+not_in_group_view)式中:man_view为该视频节目被男性观看的次数,woman_view为被女性观看的数次;in_group_view为该视频节目被属于年龄段[min_age,max_age]用户(如25~40岁的用户)的观看次数,not_in_group_view为不属于年龄段[min_age,max_age]用户(如25~40岁以外的用户)的观看次数;
将所有视频节目分别按I1、I2值大小进行两个排序,分别称为I1排序和I2排序;在每个排序中为每个视频节目赋予相应ID编号;
所述VideoBag打包模块3将所述视频节目鉴别能力计算和排序模块2给出的I1排序和I2排序,分别依序每m个视频节目打包在一起得到一个VideoBag,最后一个VideoBag中视频节目不足m个则按实际数量;从1开始,为每个VideoBag赋予一个编号,从而得到分别对应I1排序和I2排序的两个VideoBag序列;
所述权重计算模块4计算各个VideoBag中所有视频节目的I1或I2绝对值的平均值;并令其为本VideoBag的权重Weight;
所述用户特征表生成模块5从所述用户数据采集模块1获取的用户视频节目观看日志,将每个用户在一段时间内观看的所有视频节目列表,将该表中的每一视频节目在I1排序和I2排序中的ID编号转换成所在VideoBag的编号和权重Weight,得到每个用户的特征列表;
由于观看次数过少的样本数据噪声较大,故剔除观看视频节目次数少于k次的用户样本;
设得到UserNum个已知性别、所属年龄段的用户特征列表;将这UserNum个用户特征列表分为两部分,一部分用于训练,另一部分用于用户测试;
所述用户性别分类模型训练模块6使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成模块5提供的一部分用户特征列表,将其中男性用户作为正样本、女性用户作为反样本进行训练,并以所述用户特征表生成模块5提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为性别模型;
所述用户年龄段分类模型训练模块7使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成模块5提供的一部分用户特征列表,将其中年龄属于要求年龄段[min_age,max_age]的用户作为正样本、其他年龄段的用户作为反样本进行训练,并以所述用户特征表生成模块5提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为年龄段模型;
所述用户性别与年龄段预测模块8对所述用户数据采集模块1获取的性别、年龄段未知的用户,依据其视频节目观看日志,使用所述性别模型预测其性别,使用所述年龄段模型预测其年龄段,得到对该用户性别与年龄段的预测结果;基于预测结果,对该用户赋予性别、年龄段标签;
所述广告投放模块9根据所述用户性别与年龄段预测模块8给出的用户性别、年龄段标签,以及所述用户数据采集模块1收集的用户性别、年龄信息,按照某广告投放的目标人群,向具有适合性别、年龄段的用户投放该广告。
实施例2:在实施例1所述的基于VideoBag特征的精准广告投放系统中,所述VideoBag打包模块3中,m取值为6000;所述用户特征表生成模块5中,k取值为5;所述用户特征表生成模块5和所述用户性别分类模型训练模块6、所述用户年龄段分类模型训练模块7中,用于训练的用户特征列表为30%UserNum个,其余70%UserNum个用于测试。
实施例3:一种基于VideoBag特征的精准广告投放方法,它依序执行以下步骤:
A.用户数据采集步骤,它获取用户视频节目观看日志,并通过网上投递的调查问卷,收集用户性别、年龄信息;
B.视频节目鉴别能力计算和排序步骤,它利用所述用户数据采集步骤收集的用户性别、年龄信息,计算各视频节目的性别鉴别能力I1和年龄鉴别能力I2
I1=(man_view-woman_view)/(man_view+woman_view)
I2=(in_group_view-not_in_group_view)/(in_group_view+not_in_group_view)式中:man_view为该视频节目被男性观看的次数,woman_view为被女性观看的数次;in_group_view为该视频节目被属于年龄段[min_age,max_age]用户(如25~40岁的用户)的观看次数,not_in_group_view为不属于年龄段[min_age,max_age]用户(如25~40岁以外的用户)的观看次数;
将所有视频节目分别按I1、I2值大小进行两个排序,分别称为I1排序和I2排序;在每个排序中为每个视频节目赋予相应ID编号;
C.VideoBag打包步骤,它将所述视频节目鉴别能力计算和排序步骤给出的I1排序和I2排序,分别依序每m个视频节目打包在一起得到一个VideoBag,最后一个VideoBag中视频节目不足m个则按实际数量;从1开始,为每个VideoBag赋予一个编号,从而得到分别对应I1排序和I2排序的两个VideoBag序列;
D.权重计算步骤,它计算各个VideoBag中所有视频节目的I1或I2绝对值的平均值;并令其为本VideoBag的权重Weight;
E.用户特征表生成步骤,它从所述用户数据采集步骤获取的用户视频节目观看日志,将每个用户在一段时间内观看的所有视频节目列表,将该表中的每一视频节目在I1排序和I2排序中的ID编号转换成所在VideoBag的编号和权重Weight,得到每个用户的特征列表;
由于观看次数过少的样本数据噪声较大,故剔除观看视频节目次数少于k次的用户样本;
设得到UserNum个已知性别、所属年龄段的用户特征列表;将这UserNum个用户特征列表分为两部分,一部分用于训练,另一部分用于用户测试;
F.用户性别分类模型训练步骤,它使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成步骤提供的一部分用户特征列表,将其中男性用户作为正样本、女性用户作为反样本进行训练,并以所述用户特征表生成步骤提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为性别模型;
G.用户年龄段分类模型训练步骤,它使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成步骤提供的一部分用户特征列表,将其中年龄属于要求年龄段[min_age,max_age]的用户作为正样本、其他年龄段的用户作为反样本进行训练,并以所述用户特征表生成步骤提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为年龄段模型;
H.用户性别与年龄段预测步骤,它对所述用户数据采集步骤获取的性别、年龄段未知的用户,依据其视频节目观看日志,使用所述性别模型预测其性别,使用所述年龄段模型预测其年龄段,得到对该用户性别与年龄段的预测结果;基于预测结果,对该用户赋予性别、年龄段标签;
I.广告投放步骤,它根据所述用户性别与年龄段预测步骤给出的用户性别、年龄段标签,按照某广告投放的目标人群,向具有适合性别、年龄段的用户投放该广告。
实施例4:在实施例3所述的基于VideoBag特征的精准广告投放方法中,所述VideoBag打包步骤中,m取值为6000;所述用户特征表生成步骤中,k取值为5;所述用户特征表生成步骤和所述用户性别分类模型训练步骤、所述用户年龄段分类模型训练步骤中,用于训练的用户特征列表为30%UserNum个,其余70%UserNum个用于测试。

Claims (4)

1.一种基于VideoBag特征的精准广告投放系统,其特征是:它包括:用户数据采集模块(1),视频节目鉴别能力计算和排序模块(2),VideoBag打包模块(3),权重计算模块(4),用户特征表生成模块(5),用户性别分类模型训练模块(6),用户年龄段分类模型训练模块(7),用户性别与年龄段预测模块(8),广告投放模块(9);
所述用户数据采集模块(1)获取用户视频节目观看日志,并通过网上投递的调查问卷,收集用户性别、年龄信息;
所述视频节目鉴别能力计算和排序模块(2)利用所述用户数据采集模块(1)收集的用户性别、年龄信息,计算各视频节目的性别鉴别能力I1和年龄鉴别能力I2
I1=(man_view-woman_view)/(man_view+woman_view)
I2=(in_group_view-not_in_group_view)/(in_group_view+not_in_group_view)
式中:man_view为该视频节目被男性观看的次数,woman_view为被女性观看的数次;in_group_view为该视频节目被属于年龄段[min_age,max_age]用户的观看次数,not_in_group_view为不属于年龄段[min_age,max_age]用户的观看次数;
将所有视频节目分别按I1、I2值大小进行两个排序,分别称为I1排序和I2排序;在每个排序中为每个视频节目赋予相应ID编号;
所述VideoBag打包模块(3)将所述视频节目鉴别能力计算和排序模块(2)给出的I1排序和I2排序,分别依序每m个视频节目打包在一起得到一个VideoBag,最后一个VideoBag中视频节目不足m个则按实际数量;从1开始,为每个VideoBag赋予一个编号,从而得到分别对应I1排序和I2排序的两个VideoBag序列;
所述权重计算模块(4)计算各个VideoBag中所有视频节目的I1或I2绝对值的平均值;并令其为本VideoBag的权重Weight;
所述用户特征表生成模块(5)从所述用户数据采集模块(1)获取的用户视频节目观看日志,将每个用户在一段时间内观看的所有视频节目列表,将该表中的每一视频节目在I1排序和I2排序中的ID编号转换成所在VideoBag的编号和权重Weight,得到每个用户的特征列表;
由于观看次数过少的样本数据噪声较大,故剔除观看视频节目次数少于k次的用户样本;
设得到UserNum个已知性别、所属年龄段的用户特征列表;将这UserNum个用户特征列表分为两部分,一部分用于训练,另一部分用于用户测试;
所述用户性别分类模型训练模块(6)使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成模块(5)提供的一部分用户特征列表,将其中男性用户作为正样本、女性用户作为反样本进行训练,并以所述用户特征表生成模块(5)提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为性别模型;
所述用户年龄段分类模型训练模块(7)使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成模块(5)提供的一部分用户特征列表,将其中年龄属于要求年龄段[min_age,max_age]的用户作为正样本、其他年龄段的用户作为反样本进行训练,并以所述用户特征表生成模块(5)提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为年龄段模型;
所述用户性别与年龄段预测模块(8)对所述用户数据采集模块(1)获取的性别、年龄段未知的用户,依据其视频节目观看日志,使用所述性别模型预测其性别,使用所述年龄段模型预测其年龄段,得到对该用户性别与年龄段的预测结果;基于预测结果,对该用户赋予性别、年龄段标签;
所述广告投放模块(9)根据所述用户性别与年龄段预测模块(8)给出的用户性别、年龄段标签,按照某广告投放的目标人群,向具有适合性别、年龄段的用户投放该广告。
2.根据权利要求1所述的基于VideoBag特征的精准广告投放系统,其特征是:所述VideoBag打包模块(3)中,m取值为6000;所述用户特征表生成模块(5)中,k取值为5;所述用户特征表生成模块(5)和所述用户性别分类模型训练模块(6)、所述用户年龄段分类模型训练模块(7)中,用于训练的用户特征列表为30%UserNum个,其余70%UserNum个用于测试。
3.一种基于VideoBag特征的精准广告投放方法,它依序执行以下步骤:
A.用户数据采集步骤,它获取用户视频节目观看日志,并通过网上投递的调查问卷,收集用户性别、年龄信息;
B.视频节目鉴别能力计算和排序步骤,它利用所述用户数据采集步骤收集的用户性别、年龄信息,计算各视频节目的性别鉴别能力I1和年龄鉴别能力I2
I1=(man_view-woman_view)/(man_view+woman_view)
I2=(in_group_view-not_in_group_view)/(in_group_view+not_in_group_view)
式中:man_view为该视频节目被男性观看的次数,woman_view为被女性观看的数次;in_group_view为该视频节目被属于年龄段[min_age,max_age]用户的观看次数,not_in_group_view为不属于年龄段[min_age,max_age]用户的观看次数;
将所有视频节目分别按I1、I2值大小进行两个排序,分别称为I1排序和I2排序;在每个排序中为每个视频节目赋予相应ID编号;
C.VideoBag打包步骤,它将所述视频节目鉴别能力计算和排序步骤给出的I1排序和I2排序,分别依序每m个视频节目打包在一起得到一个VideoBag,最后一个VideoBag中视频节目不足m个则按实际数量;从1开始,为每个VideoBag赋予一个编号,从而得到分别对应I1排序和I2排序的两个VideoBag序列;
D.权重计算步骤,它计算各个VideoBag中所有视频节目的I1或I2绝对值的平均值;并令其为本VideoBag的权重Weight;
E.用户特征表生成步骤,它从所述用户数据采集步骤获取的用户视频节目观看日志,将每个用户在一段时间内观看的所有视频节目列表,将该表中的每一视频节目在I1排序和I2排序中的ID编号转换成所在VideoBag的编号和权重Weight,得到每个用户的特征列表;
由于观看次数过少的样本数据噪声较大,故剔除观看视频节目次数少于k次的用户样本;
设得到UserNum个已知性别、所属年龄段的用户特征列表;将这UserNum个用户特征列表分为两部分,一部分用于训练,另一部分用于用户测试;
F.用户性别分类模型训练步骤,它使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成步骤提供的一部分用户特征列表,将其中男性用户作为正样本、女性用户作为反样本进行训练,并以所述用户特征表生成步骤提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为性别模型;
G.用户年龄段分类模型训练步骤,它使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成步骤提供的一部分用户特征列表,将其中年龄属于要求年龄段[min_age,max_age]的用户作为正样本、其他年龄段的用户作为反样本进行训练,并以所述用户特征表生成步骤提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为年龄段模型;
H.用户性别与年龄段预测步骤,它对所述用户数据采集步骤获取的性别、年龄段未知的用户,依据其视频节目观看日志,使用所述性别模型预测其性别,使用所述年龄段模型预测其年龄段,得到对该用户性别与年龄段的预测结果;基于预测结果,对该用户赋予性别、年龄段标签;
I.广告投放步骤,它根据所述用户性别与年龄段预测步骤给出的用户性别、年龄段标签,按照某广告投放的目标人群,向具有适合性别、年龄段的用户投放该广告。
4.根据权利要求3所述的基于VideoBag特征的精准广告投放方法,其特征是:所述VideoBag打包步骤中,m取值为6000;所述用户特征表生成步骤中,k取值为5;所述用户特征表生成步骤和所述用户性别分类模型训练步骤、所述用户年龄段分类模型训练步骤中,用于训练的用户特征列表为30%UserNum个,其余70%UserNum个用于测试。
CN201210009483.2A 2012-01-13 2012-01-13 一种基于VideoBag特征的精准广告投放系统及方法 Expired - Fee Related CN102708497B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210009483.2A CN102708497B (zh) 2012-01-13 2012-01-13 一种基于VideoBag特征的精准广告投放系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210009483.2A CN102708497B (zh) 2012-01-13 2012-01-13 一种基于VideoBag特征的精准广告投放系统及方法

Publications (2)

Publication Number Publication Date
CN102708497A CN102708497A (zh) 2012-10-03
CN102708497B true CN102708497B (zh) 2015-08-05

Family

ID=46901227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210009483.2A Expired - Fee Related CN102708497B (zh) 2012-01-13 2012-01-13 一种基于VideoBag特征的精准广告投放系统及方法

Country Status (1)

Country Link
CN (1) CN102708497B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9626597B2 (en) 2013-05-09 2017-04-18 Tencent Technology (Shenzhen) Company Limited Systems and methods for facial age identification
CN104143097B (zh) * 2013-05-09 2017-02-08 腾讯科技(深圳)有限公司 分类函数获取方法、人脸年龄识别方法、装置和设备
CN104143079B (zh) 2013-05-10 2016-08-17 腾讯科技(深圳)有限公司 人脸属性识别的方法和系统
CN104391883B (zh) * 2014-11-05 2017-06-20 北京航空航天大学 一种基于迁移学习的在线广告受众排序方法
CN106204091A (zh) * 2015-05-28 2016-12-07 阿里巴巴集团控股有限公司 数据处理方法和装置
CN104991899B (zh) * 2015-06-02 2018-06-19 广州酷狗计算机科技有限公司 用户属性的识别方法及装置
CN105005593B (zh) * 2015-06-30 2018-03-27 北京奇艺世纪科技有限公司 多用户共用设备的场景识别方法和装置
CN105069041A (zh) * 2015-07-23 2015-11-18 合一信息技术(北京)有限公司 基于视频用户性别分类的广告投放方法
CN106056083B (zh) * 2016-05-31 2019-08-13 腾讯科技(深圳)有限公司 一种信息处理方法及终端
CN106202570A (zh) * 2016-08-11 2016-12-07 乐视控股(北京)有限公司 一种用户信息获取方法及装置
CN106507147A (zh) * 2016-11-30 2017-03-15 天脉聚源(北京)科技有限公司 广告的处理方法及装置
CN106599834A (zh) * 2016-12-13 2017-04-26 浙江省公众信息产业有限公司 信息推送方法和系统
CN107341200A (zh) * 2017-06-20 2017-11-10 北京微影时代科技有限公司 判断观影用户性别的方法及影片推荐方法
CN110020155A (zh) * 2017-12-06 2019-07-16 广东欧珀移动通信有限公司 用户性别识别方法及装置
CN110310148A (zh) * 2019-06-05 2019-10-08 上海易点时空网络有限公司 基于大数据和机器学习的广告精准投放方法
CN110827074A (zh) * 2019-10-31 2020-02-21 夏振宇 采用视频语音分析进行广告投放评估的方法
CN110992096B (zh) * 2019-12-03 2023-08-29 秒针信息技术有限公司 预测模型训练方法、装置以及媒体标识预测方法及装置
CN112561589B (zh) * 2020-12-18 2023-01-10 成都屏盟科技有限公司 广告投放方法、装置及存储介质
CN113726900A (zh) * 2021-09-02 2021-11-30 四川启睿克科技有限公司 一种判断用户儿童年龄段的系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007249306A (ja) * 2006-03-13 2007-09-27 Fuzzy Logic Systems 情報配信システム、情報配信方法及びプログラム
CN101635009A (zh) * 2009-08-21 2010-01-27 腾讯科技(深圳)有限公司 基于海量数据的用户年龄估算方法及系统
CN102722832A (zh) * 2012-01-05 2012-10-10 合一网络技术(北京)有限公司 在线视频广告精细化定向投放方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1958201B1 (en) * 2005-11-10 2013-02-27 QDC IP Technologies Pty Ltd Personalised video generation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007249306A (ja) * 2006-03-13 2007-09-27 Fuzzy Logic Systems 情報配信システム、情報配信方法及びプログラム
CN101635009A (zh) * 2009-08-21 2010-01-27 腾讯科技(深圳)有限公司 基于海量数据的用户年龄估算方法及系统
CN102722832A (zh) * 2012-01-05 2012-10-10 合一网络技术(北京)有限公司 在线视频广告精细化定向投放方法

Also Published As

Publication number Publication date
CN102708497A (zh) 2012-10-03

Similar Documents

Publication Publication Date Title
CN102708497B (zh) 一种基于VideoBag特征的精准广告投放系统及方法
CN106796550B (zh) 信息配送装置以及方法
WO2013055957A1 (en) Method and system of evaluating the impact of distributed digital content
TW201403514A (zh) 根據接近中的物體選擇顯示於數位標牌上的廣告之方法與設備
WO2011017133A4 (en) Providing a classification suggestion for concepts
CN104657336B (zh) 一种基于半余弦函数的个性化推荐方法
CN103942603B (zh) 一种广告点击率的预估方法和装置
CN105069041A (zh) 基于视频用户性别分类的广告投放方法
EP2113849A3 (en) Information processing apparatus and presenting method of related items
EP2453372A3 (en) Information processing apparatus and method, information processing system, and program
Eisend A cross-cultural generalizability study of consumers' acceptance of product placements in movies
EP2325606A3 (en) Method for identifying a candidate part of a map to be updated
KR101390296B1 (ko) 개인 맞춤형 서비스 과금방법 및 장치
CN107146096A (zh) 一种智能视频广告展示方法及装置
CN105590240A (zh) 一种品牌广告效果优化的离散计算方法
CN108665310A (zh) 一种基于探测预估技术的广告投放方法及系统
CN102722832A (zh) 在线视频广告精细化定向投放方法
CN103258195A (zh) 一种基于面部识别的导购装置以及方法
CN105447193A (zh) 一种基于机器学习和协同过滤的音乐推荐系统
CN110727859A (zh) 一种推荐信息推送方法及其装置
US20220122118A1 (en) Planning device and computer program
CN1802663A (zh) 接触点导航系统和方法,记录该方法的记录介质及传输该方法的传输介质
CN103455510B (zh) 一种对用户评价的方法和装置
CN106650698A (zh) 一种基于智能平台的数据采集方法及系统
CN113763027B (zh) 推荐信息处理方法、推荐信息生成方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Patentee after: Youku network technology (Beijing) Co.,Ltd.

Address before: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Patentee before: 1VERGE INTERNET TECHNOLOGY (BEIJING) Co.,Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20200318

Address after: 310007 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Patentee before: Youku network technology (Beijing) Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150805

Termination date: 20210113

CF01 Termination of patent right due to non-payment of annual fee