CN105989004B - 一种信息投放的预处理方法和装置 - Google Patents
一种信息投放的预处理方法和装置 Download PDFInfo
- Publication number
- CN105989004B CN105989004B CN201510041351.1A CN201510041351A CN105989004B CN 105989004 B CN105989004 B CN 105989004B CN 201510041351 A CN201510041351 A CN 201510041351A CN 105989004 B CN105989004 B CN 105989004B
- Authority
- CN
- China
- Prior art keywords
- user
- information
- characteristic
- value
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000007781 pre-processing Methods 0.000 title claims abstract description 32
- 238000004458 analytical method Methods 0.000 claims description 68
- 238000012549 training Methods 0.000 claims description 42
- 239000011159 matrix material Substances 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 10
- 230000009471 action Effects 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 9
- 230000001960 triggered effect Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims 1
- 239000002699 waste material Substances 0.000 abstract description 7
- 230000006399 behavior Effects 0.000 description 53
- 238000010586 diagram Methods 0.000 description 20
- 230000000694 effects Effects 0.000 description 11
- 238000003860 storage Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000002372 labelling Methods 0.000 description 7
- 238000013507 mapping Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004141 dimensional analysis Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种信息投放的预处理方法和装置,以解决精准的定位来推荐业务对象以防止资源浪费的技术问题。所述的方法包括:在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息;根据特征信息确定分类标签及其用户群,为每个分类标签创建业务对象组;计算特征信息所属分类标签对应用户群的群体价值信息;依据所述群体价值信息设置所述业务对象组的价值特征信息,其中,所述价值特征信息用于确定网页展示位中展示的业务对象组。从而能够全面、准确地确定用户所具有的特征,可以在投放广告前准确分析用户所属分类标签并确定对应业务对象组及其价值特征信息,使得后续所投放的业务对象定位更精准,符合用户期望和需求。
Description
技术领域
本申请涉及数据处理技术领域,特别是涉及一种信息投放的预处理方法和一种信息投放的预处理装置。
背景技术
随着互联网技术的发展,用户常常在网络中查找各种信息,浏览相关网页。用户在网络中搜索信息时往往采用搜索网站如Google、百度等,从而通过其搜索引擎反馈相应的搜索结果进行查找。
由于搜索引擎上有大量的用户查询流量,因此当需要推荐某些业务对象的信息时,可以将其投放给搜索引擎以进行推荐。搜索引擎对这类业务对象的推荐可以是将其展示在与搜索引擎合作的网站提供展示位上,同时为了兼顾投放质和量的需求,可以对展示位的流量进行重定向(retargeting),只购买展示的业务对象流量中到曾经到达过网站的用户。
对业务对象的推荐后,用户可以点击查看该业务对象,进而执行与该业务对象相关的操作,因此对用户精准的定位才能提高对业务对象的点击率,使得推荐更符合需求。对于定位不准确而推荐的业务对象,不但点击率较低,也造成了网站展示位资源的浪费,以及用户网络流量资源的浪费。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:如何精准的定位来推荐业务对象以防止资源浪费。
发明内容
本申请实施例所要解决的技术问题是提供一种信息投放的预处理方法,以解决精准的定位来推荐业务对象以防止资源浪费的技术问题。
相应的,本申请实施例还提供了一种信息投放的预处理装置,用以保证上述方法的实现及应用。
为了解决上述问题,本申请公开了一种信息投放的预处理方法,包括:在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息;根据所述特征信息确定分类标签及其用户群,为每个分类标签创建业务对象组;计算特征信息所属分类标签对应用户群的群体价值信息;依据所述群体价值信息设置所述业务对象组的价值特征信息,其中,所述价值特征信息用于确定网页展示位中展示的业务对象组。
本申请还公开了一种信息投放的预处理装置,包括:特征分析模块,用于在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息;标签分析模块,用于根据所述特征信息确定分类标签及其用户群;创建模块,用于为每个分类标签创建业务对象组;群体价值计算模块,用于计算特征信息所属分类标签对应用户群的群体价值信息;价值特征设置模块,用于依据所述群体价值信息设置所述业务对象组的价值特征信息,其中,所述价值特征信息用于确定网页展示位中展示的业务对象组。
与现有技术相比,本申请实施例包括以下优点:
在本申请实施例中,通过基于用户的当前访问网页和历史行为信息确定所述用户的特征信息,从而全面、准确地确定用户所具有的特征,再基于各用户的特征信息分析出对应的分类标签,以及该分类标签所对应的用户群,并为每个分类标签创建业务对象组,即可以基于用户当前和历史行为分析出其所对应的业务对象组,从而后续精准的定位推荐的业务对象。并且,还采用特征信息分析其所属分类标签对应用户群的群体价值信息,进而设置业务对象组的价值特征信息,准确的分析每个业务对象组的价值,以在投放广告时依据其价值特征信息准确的确定投放的业务对象,从而通过上述投放的预处理操作,可以在投放广告前准确分析用户所属分类标签并确定对应业务对象组及其价值特征信息,使得后续所投放的业务对象定位更精准,符合用户期望和需求。
附图说明
图1是本申请实施例提供的一种信息投放的预处理方法的步骤流程图;
图2是本申请实施例提供的另一种信息投放的预处理方法的步骤流程图;
图3是本申请实施例提供的搜索引擎广告投放架构示意图;
图4是本申请实施例提供的搜索引擎和网站的广告投放交互示意图;
图5是本申请实施例提供的一种信息投放的预处理装置的结构框图;
图6A-E是本申请实施例提供的另一种信息投放的预处理装置的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
网站对自身所展示的目标对象进行推荐时,可以生成其对应的业务对象并投放到其它网站的网页上进行展示。若用户对推荐的业务对象感兴趣即可点击该业务对象来查看对应的目标对象,因此在向网站投放业务对象时,对用户和所投放业务对象的精准定位有助于提高业务对象的点击率,获得更好的推荐效果,反之若定位不准确则网站的展示位中展示的业务对象点击率较低,造成流量资源的浪费且达不到推荐效果。
本申请实施例的核心构思之一在于,提出一种信息投放的预处理方法,以解决精准的定位来推荐业务对象以防止资源浪费的技术问题。可以在投放广告前准确分析用户所属分类标签并确定对应业务对象组及其价值特征信息,使得后续所投放的业务对象定位更精准,符合用户期望和需求。
实施例一
参照图1,示出了本申请实施例提供的一种信息投放的预处理方法的步骤流程图,具体可以包括如下步骤:
步骤102,在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息。
在为用户推荐业务对象时,需要为用户推荐其感兴趣的业务对象才能得到用户的关注并点击查看,因此,可以预先设置业务对象的分类标签,采用该分类标签标记业务对象的类别,从而依据用户所具有的分类标签推荐相应的业务对象。通常分类标签是对用户当前访问网页进行标注确定的,如网页标题、网页关键字等,但是当前访问网页并不一定是用户感兴趣的,可能是由用户误操作等开启的,因此仅基于当前访问网页确定用户具有的分类标签准确性较低。
本实施例中,在用户访问网站时,可以获取该当前访问网页,以及其历史行为信息,历史行为信息指的是该用户在该网站的访问历史,如在所述网站中历史浏览器的网页,在网页中执行的操作等。从而分别通过对当前访问网页和历史行为信息的分析,确定该用户的特征信息。所述特征信息指的是用户在网站中的访问特征,其包括各类特征及其特征值,例如访问网站的次数、访问过的网页标题、关键字等。
步骤104,根据特征信息确定分类标签及其用户群,为每个分类标签创建业务对象组。
特征信息标识了用户在网站中的访问特征,因此对所有访问网站的用户的特征信息进行分析就可以获取访问该网站的用户的群体特征,从而确定该网站所具有的分类标签,以及每个标签所对应的用户群。
再为每个分类标签创建一个业务对象组,该业务对象组是具有相同特征的业务对象的集合,如具有相同类目、具有相同来源等。从而投放广告时确定一个用户所属用户群的分类标签,即可确定为其推荐的业务对象组。本实施例中为用户推荐的业务对象是基于用户历史行为信息所确定的,所确定的分类标签准确性更高,能够确定更符合用户期望的业务对象。
步骤106,计算特征信息所属分类标签对应用户群的群体价值信息。
通过用户所属用户群的分类标签可以确定对应的业务对象组,但是一个用户可能同时属于多个用户群,即对应多个业务对象组,因此在对用户进行业务对象的推荐时,就要分析实际的推荐方式以获取更高的点击率、更好的推荐效果。
本实施例中设置了用户群的群体价值信息,该群体价值信息用于衡量投放该用户群对应业务对象组的价值。可以对各用户的特征信息进行分析,如通过模型训练等方式计算该特征信息所属分类标签对应用户群的群体价值信息。
步骤108,依据所述群体价值信息设置所述业务对象组的价值特征信息。
本实施例中,设置了价值特征信息来标识业务对象组的价值,所述价值特征信息用于确定网页展示位中展示的业务对象组,因此可以通过群体价值信息设置所述业务对象组的价值特征信息。从而在其他网站中投放业务对象时,可以基于该用户所对应的业务对象组的价值特征信息确定投放的业务对象。
综上所述,本实施例通过基于用户的当前访问网页和历史行为信息确定所述用户的特征信息,从而全面、准确地确定用户所具有的特征,再基于各用户的特征信息分析出对应的分类标签,以及该分类标签所对应的用户群,并为每个分类标签创建业务对象组,即可以基于用户当前和历史行为分析出其所对应的业务对象组,从而后续精准的定位推荐的业务对象。并且,还采用特征信息分析其所属分类标签对应用户群的群体价值信息,进而设置业务对象组的价值特征信息,准确的分析每个业务对象组的价值,以在投放广告时依据其价值特征信息准确的确定投放的业务对象,从而通过上述投放的预处理操作,可以在投放广告前准确分析用户所属分类标签并确定对应业务对象组及其价值特征信息,使得后续所投放的业务对象定位更精准,符合用户期望和需求。
本申请实施例中,信息投放可以应用于多种不同的场景中,例如广告的推荐投放、新闻等信息的推送投放等,即应用场景不同推送的业务对象也不同,可以依据实际需求设定。
实施例二
在上述实施例的基础上,本实施例详细论述信息投放的预处理方法。
参照图2,示出了本申请实施例提供的另一种信息投放的预处理方法的步骤流程图,具体可以包括如下步骤:
步骤202,在用户访问网站时,分别获取所述用户的当前访问网页和历史行为信息。
步骤204,按照一种或多种维度分别对所述当前访问网页和历史行为信息进行分析,确定所述用户的特征信息。
用户访问网站浏览网页时,可以获取该用户的当前访问网页,并获取该用的历史行为信息。例如,针对购物网站,可以获取用户当前浏览的购物页面,并且获取该用户对购物网站的历史行为信息,如在网站中的搜索历史,网站中的购物信息等。
由于用户对网站和网页的访问是一个完整的操作行为,因此对于其对应的信息可以通过多个维度进行衡量,即通过一种或多种维度分别对所述当前访问网页和历史行为信息进行分析,例如通过文本维度、时间维度、操作维度等多种维度分别进行分析,从而获取全面、综合、准确的分析结果。
(1)对当前访问网页的分析
本申请一个可选实施例中,对所述当前访问网页进行分析确定所述用户的特征信息的步骤,包括:按照文本维度对所述当前访问网页的文本信息进行分析,从所述文本信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信息。
用户所访问的网页通常具有一定的文本特征,且该文本特征能够反映出用户对该网页的兴趣点,因此可以基于文本维度对当前访问网页的文本信息进行分析,如对网页的标题、正文进行文本分析,确定其中的关键词等信息,从而从网页中获取与所推荐业务对象相关的业务特征和所述业务特征的特征值作为所述用户的特征信息。
其中,由于应用场景不同时,推荐的业务对象也不同,因此在进行文本分析时对文本的标注点也不同,例如针对购物网站,可以提取网页中与购物商品相关的商品名称、商品类目以及诸如制造商、卖家等相关商品信息作为业务特征的特征值。
还包括:针对操作维度,通过对所述用户在当前访问网页内执行的操作信息的分析,提取所述用户的分类特征及其特征值,其中,所述操作信息包括:停留时间数据和动作执行数据。
用户在浏览网页时,除了网页内容本身能够显示用户的兴趣点之外,用户在网页中执行的操作也能显示用户的兴趣,例如,用户在开启网页很短时间(如5秒)内即关闭网页,则可能表征用户对该网页不感兴趣,如该网页是由误操作而开启的。又如,用户在网页中点击或选中某些内容等操作,表征用户可能对其有兴趣。
因此可以对用户在当前访问网页中执行的操作信息进行分析,所述操作信息包括:停留时间数据和动作执行数据,即分析具体的操作、操作对象以及操作时间等信息,从而提取相应的分类特征,以及分类特征的特征值。
从而网页本身和用户操作确定多种维度进行网页分析确定该用的特征信息。
(2)对历史行为信息的分析
对所述历史行为信息进行分析确定所述用户的特征信息的步骤包括以下子步骤一到三中至少一项:
步骤一:按照文本维度对所述历史行为信息中的文本信息进行分析,从所述文本信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信息。
与当前访问网页的文本分析类似,用户历史行为信息中包括历史搜索和浏览记录,因此用户历史行为信息的文本信息包括历史搜索记录,以及历史浏览网页的文本等信息,从而通过对文本信息的分析,可以获取相应的业务特征及其特征值。
步骤二:按照时间维度对所述历史行为信息中的时间相关信息进行分析,从所述时间相关信息中提取阶段特征和所述阶段特征的特征值作为用户的特征信息。
用户的历史行为信息中包括很多时间相关信息,例如用户对历史网页的浏览时间、用户对历史网页所执行操作的时间等。例如对于购物网站,用户的历史行为信息包括其历史搜索、购买商品的时间,历史购买的商品所处的阶段等,以及用户对购物网站的访问次数等与时间相关的信息。
因此,可以在时间维度上对历史行为信息中的时间相关信息进行分析,确定用户对网站访问的规律、活跃度等,从所述时间相关信息中提取阶段特征和所述阶段特征的特征值作为用户的特征信息,例如用户访问网站的次数、频率等。
步骤三:按照其他维度对所述历史行为信息中的关联信息进行分析,从所述关联信息中提取地域特征及其特征值,和/或,设备特征及其特征值作为用户的特征信息。
还可以按照其他维度对所述历史行为信息中的关联信息进行分析,从关联信息中提取地域特征及其特征值,如访问购物网站时,确定用户购买商品的寄送地址、商品产地等,或者从关联信息中提取设备特征及其特征值,如用户访问网站所使用的设备,如采用移动设备,以及具体的移动设备等。
从而通过多种维度的分析得到多维的特征信息,全面、准确的分析访问网站的用户所具有的特征。
步骤206,获取各用户的特征信息中的特征值,确定各特征值对应匹配的分类标签。
步骤208,针对每个分类标签,通过特征值圈定所述分类标签对应的用户构成用户群。
本实施例中,对网站中所有用户的特征信息进行分析,确定相应的分类标签,每一种特征对应一个或多个分类标签,而每个分类标签对应一个或多个特征值,从而确定用户的特征信息中各特征值对应匹配的分类标签。
分类标签的设置可以依据实际需求确定,例如在购物网站中,业务特征包括类目特征和商品特征,而一个类目可以作为一个分类标签,则一个分类标签可能对应多个商品特征的特征值。而对于设备特征、地域特征则可以各自对应一个分类标签。
由于每个分类标签对应一个或多个特征值,因此针对每个分类标签,通过其所对应的特征值圈定该特征值所对应用户,构成该分类标签的用户群
步骤210,为每个分类标签创建业务对象组。
由于在投放时是按照用户所具有的分类标签确定投放的业务对象,因此要为每个分类标签创建一个业务对象组,该业务对象组中包括属于该分类标签的各业务对象。
然后分析每个业务对象组所对应用户群的群体价值信息,以通过用户群的群体价值信息设置业务对象组的价值特征信息,据此确定业务对象的投放。
步骤212,对第一时间段内各用户的特征信息进行特征分析,确定用户群的价值权重。
针对任意用户群,可以获取第一时间段内该用户群中各用户的特征信息进行特征分析,例如采用模型训练获取该用户群的价值权重,该价值权重用于预估用户群的全体价值信息。
本申请一个可选实施例中,所述对第一时间段内各用户的特征信息进行特征分析,确定用户群的价值权重,包括:对所述第一时间段进行切分,确定训练时间段和测试时间段;对所述训练时间段内各用户的特征信息进行特征分析确定特征矩阵;从所述测试时间段内各用户的特征信息中抽取训练目标;对所述特征矩阵和训练目标进行回归训练,计算所述用户群的价值权重。
将第一时间段切分为两部分,前一部分作为训练时间段,后一部分作为测试时间段。然后采用训练时间段内各用户的特征信息进行特征分析确定特征矩阵,生成特征模型。从所述测试时间段内各用户的特征信息中抽取训练目标,对特征模型进行模型训练,即对所述特征矩阵和训练目标进行回归训练,计算该用户群的价值权重。
步骤214,对第二时间段内各用户的特征信息进行特征分析,并通过所述价值权重的加权计算确定所述用户群的群体价值信息。
第二时间段可以使进行投放预测前的一段时间,在对该第二时间段内各用户的特征信息进行特征分析后,通过价值权重对分析结果进行加权计算,确定所述用户群的群体价值信息。
本申请一个可选实施例中,对第二时间段内各用户的特征信息进行特征分析,并通过所述价值权重的加权计算确定所述用户群的群体价值信息,包括:对第二时间段内各用户的特征信息进行特征分析确定预测的特征矩阵;采用所述价值权重对所述预测的特征矩阵进行加权,计算确定所述用户群的群体价值信息。在对第二时间段内各用户的特征信息进行特征分析时,可以计算该用户的特征矩阵,然后采用价值权重对所述预测的特征矩阵进行加权,计算确定所述用户群的群体价值信息。
步骤216,通过预设的目标价值信息和所述用户群的群体价值信息,计算所述业务对象组的价值特征信息。
本实施例中,预先设置了目标价值信息,该目标价值信息指的是业务对象投放后预期获取的价值,因此对于业务对象组的价值特征信息,可以采用预设的目标价值信息和所述用户群的群体价值信息进行计算得到。
步骤218,根据所述用户的特征信息确定所述用户对应的候选分类标签。
每个用户访问网站时都可以分析出其所具有的特征信息,由于一个用户特征具有多种特征信息,各特征的特征值对应了分类标签,而不能对每种特征都投放其相应的业务对象,因此要从该用户所对应分类标签总筛选候选分类标签。
本申请一个可选实施例中,根据所述用户的特征信息确定所述用户对应的候选分类标签,包括:从所述用户访问网站的数据库中筛选所述用户的业务特征的特征值对应关联特征信息;按照所述关联特征信息计算每个业务特征的特征值的排序分值;按照所述排序分值对所述用户的业务特征的特征值进行排序,确定排序结果;从所述排序结果中筛选前N个业务特征的特征值,将筛选的特征值对应分类标签作为特征分类标签。
本实施例中,将业务对象对应的网页内容称为目标对象,例如针对购物网站的广告,该广告所对应购物网站的商品即为目标对象。数据库中存储有目标对象的各种关联特征,如对于某一商品其存储有订单数量,该商品的点击数量等特征。因此针对用户业务特征的各特征值,可以获取该特征值的关联特征信息,然后采用关联特征信息计算每个业务特征的特征值的排序分值。
再按照排序分值由大到小的顺序对该用户的每个特征值进行排序,获取相应的排序结果。再从该排序结果中筛选出前N个特征值,其中N为正整数,将筛选出的特征值对应分类标签作为特征分类标签。特征分类标签为该用户兴趣较高的分类标签,可以用于确定投放的业务对象,以及选中业务对象后所显示登陆页面中展示的目标对象。
步骤220,按照所述候选分类标签设置所述用户的登陆页面。
在网站中投放业务对象的目的之一是希望用户基于该业务对象访问其对应网站的网页以查看目标对象,因此本实施例中还配置了业务对象被点击触发后显示的登录页面,即登陆页面为触发所述网页展示位中展示的业务对象所链接到的页面。
由于每个用户具有多个分类标签,而其触发的分类标签仅是其中的一个,因此为了更全面的为用户推荐目标对象,可以在该登录页面中展示触发分类标签的目标对象,以及该用户所具有的其他候选分类标签的目标对象。
本申请一个可选实施例中,按照所述候选分类标签设置所述用户的登陆页面,包括:按照所述候选分类标签确定检索关键词对目标对象进行检索,获取检索到的目标对象;按照所述候选分类标签的排序分值,对所述检索到的目标对象的点击数据进行修正;按照修正的点击数据对所述检索到的目标对象进行排序;依据排序结果生成包含所述检索到的目标对象的登录页面。
针对每个候选分类标签其对应一定的特征值,可以以该特征值为检索关键词对网站中的目标对象进行检索,获取检索到的目标对象,然后按照候选分类标签的排序分值对检索到的目标对象的点击数据进行修正,按照修正的点击数据由多到少的顺序对所述检索到的目标对象进行排序,依据排序结果生成包含所述检索到的目标对象的登录页面。
综上,可以通过文本维度、时间维度、操作维度以及其他维度等一种或多种维度分别对用户的当前访问网页和历史行为信息进行分析,从而获取与该维度相关的特征及其特征值构成特征信息,通过多维分析得到的特征信息更加全面、准确。
其次,基于各用户的特征信息,确定每个特征值对应匹配的分类标签,进而圈定每个分类标签的用户群,确定具有该分类标签的用户群体,得到用户的群体特征。
再次,可以通过模型训练等方式对特征信息进行特征分析确定用户群的价值权重,从而基于预测前的第二时间段内用户的特征信息分析该用户群的群体价值信息,基于用户的行为能够得到更准确的群体价值信息,继而计算所述业务对象组准确的价值特征信息,准确的该价值特征信息能够提高业务对象的投放准确性,使得投放符合用户预期,得到更好的推荐效果。
再次,根据用户历史行为分析出的特征信息选取排序分支较高的候选分类标签,从而基于该候选分类标签检索目标对象生成所述用户的登陆页面,使得用户在触发业务对象时不仅展示与该业务对象相关的目标对象,还显示该用户可能感兴趣的其他目标对象,使得推荐更加全面。
实施例三
本实施例中,采用广告投放的场景为例,基于搜索引擎的竞价方式进行广告投放来举例论述对其预处理方法。
投放搜索引擎文字广告是一种有效拓展网站流量的方式。这种方式引入流量由于带有用户查询关键词(query),具有明确的意图,是电商平台优先考虑购买的流量。但对于大批量流量购买的电商平台,搜索引擎文字广告流量有限,不能满足量的需求。这时电商平台会考虑展示广告流量。展示广告流量一般是由与搜索引擎合作的网站提供展示位广告位上的访问流量。展示广告的流量可能是搜索引擎文字广告量的10倍以上,但流量质量会显著差于搜索引擎文字广告。为了同时兼顾投放质和量的需求,可以对展示广告流量进行重定向(retargeting),只购买展示广告流量中到曾经到达过网站的用户。
这是因为数据分析发现,电商平台流量中的老用户会比新用户带来更多的商业价值。老用户熟悉平台的操作规则,对平台具有一定的忠诚度,因此容易更快更多地带来转化。电商平台在进行流量购买时,会优先考虑召回已经访问过网站的老用户。这部分老用户也称之为再营销流量(Remarketing或者Retargeting)。其中,再营销Remarketing是流量采购的一种方式,定位人群为网站老用户。
假设,广告信息作为业务对象,则广告组为业务对象组,目标对象为商品信息,广告投放时可以基于搜索引擎的竞价规则进行投放,因此竞价信息即为预估的业务对象组的价值特征信息。
再营销在标注人群分类标签时,通常是根据当前访问网页的内容进行静态标注。其标注的分类标签可以是基于:一、网页的关键词;二、网页的标题;三、网页类目导航中类目,即标注的分类标签来自于网页的静态内容,因此所确定的分类标签准确性较低,而本实施例引入用户历史行为信息,通过用户的历史行为进行确定分类标签以及广告的竞价等信息,对投放广告的定位更加精准。其中,搜索引擎广告投放架构示意图如图3所示,搜索引擎和网站的广告投放交互示意图如图4所示。
4.02网站埋点。
在指定购物网站的网页上埋点,即在该网页中插入搜索引擎的再营销的JS(JavaScript)代码。该JS代码可以获取在该网站访问的用户的分类标签,从而后续进行广告的投放。
4.04获取用户的当前访问网页和历史行为信息。
4.06分析用户的特征信息。
本实施例中,通过对当前访问网页和历史行为信息的一维或多维分析所得到的分类特征的主要分类三类:一、购买意图即业务特征,表征用户想要购买或采购的商品,可以用商品词或者类目来描述;二、购买阶段即阶段特征,在确定购买意图后,根据用户访问历史数据中的到访次数、到访频率、离站时间和转化阶段等数据可以表征用户所处的购买阶段;三、购买习惯即其他特征,用户的购买习惯可以通过用户所在国家、设备等反应,如表1所示。
表1
4.08发送访问用户的投放信息给搜索引擎。
用户在访问埋点网页时,会执行网页中的再营销JS代码,然后回想该搜索引擎发送身份标识gid和该用户的分类标签tag,该分类标签tag是通过对当前浏览网页和历史行为信息的分析确定的。该身份标识gid是搜索引擎为用户分配的唯一标识。
4.10依据各用户的特征信息确定分类标签及其用户群。
依据上述表1所述的特征信息,至少可以分析如下分类标签:
1)keyword是指用户在网站搜索过或浏览的商品词,可以包括一个或多个。
2)category是指用户在网站浏览过的类目或者所查找商品所属的类目,同样可以包括一个或多个。
3)visit_cnt是指用户访问网站的次数,即会话数量。
4)visit_freq是指单位时间内用户访问网站的次数。
5)left_time是指用户离开网站的时间。
6)trans_step是指用户所处的采购阶段,例如搜索、加入购物车或支付等。
7)country是指用户所在的国家,例如,US代表美国。
8)device是指用户访问网站的设备,例如,MB代表手机等移动设备。
本实施例中,针对再营销方式,在对静态网页进行标注确定分类特征的基础上,还分析了访问用户的历史行为信息,采用历史数据和当前网页内容同时对人群进行标注分类,即对访问用户进行多维度的标签标准,并精准圈定分类标签的用户群。并且,还会根据访问用户在当前页的停留时间和操作动作等确定特征信息对应分类标签。当前上述特征信息及确定的分类标签仅用于举例论述本实施例,实际处理中还可以依据需求分析其他特征信息,如浏览或点击过商品、购买商品的周期和购买时间点等。
4.12为每个分类标签设置一个广告组adgroup。
其中,广告组adgroup是广告账户结构中的一种粒度。
4.14基于用户群中各用户的特征信息确定群体价值信息。
4.16基于群体价值信息设置各广告组的竞价
通常,再营销的竞价设置由人工经验决定,运营专员会根据投放市场行情以及不同广告组对应网站内行业情况进行设定。但这种设置方式过于粗略,难以批量应用于大量的广告组,竞价调整成本也非常高,效果也难以达到预期。
本实施例为了同时兼顾投放效率和效果,合理的设置竞价,因此要准确的预估广告组对应用户群的群体价值信息以合理的设置竞价。本申请根据用户群的分类标签和特征预估人群价值,设置对应的竞价,从而达到较好的投放效果。对群体价值信息的预估可以包括如下两个阶段:
1)模型训练
取一段时间的网站访问用户u,并在时间上进行切分,时间段t1作为训练时间段,时间段t2作为测试时间段。按照时间段t1内分析的用户特征对训练数据进行特征抽取,得到由用户和分类标签构成的特征矩阵:
训练目标为群体价值信息,本实施例中,群体价值信息指的是访问用户所带来的收益与访问会话次数的比值:
再根据时间段t2获取的特征信息作为测试数据,抽取训练目标。
v=[value1,value2,...,valuen]t2 T 公式3
采用线性回归做训练,即求解特征的权重系数w。
F*w=v 公式4
w=F-1*v 公式5
本实施例中,除了采用线性回归模型之外,还可以采用逻辑回归模型或回归树模型等,可以依据实际需求选取。
2)群体价值信息预估
在进行群体价值信息预估时,需要对待预测用户预测前时间段t3的数据进行特征抽取,得到特征矩阵:
分类标签对应群体价值信息可以根据公式7得到:
v′=F′*w=F′*F-1*v 公式7
从而通过群体价值信息计算得到最终的竞价,其计算公式如下所示:
其中,bid为竞价,ROIth为设定的营收比目标,α为经验参数。其中,ROI为Revenueon Investment,即投资回报比,收益与投入的比值。
4.18设置访问用户的登录页面。
再营销方式中广告组的登陆页是在创建广告组后设定的,根据分类标签来确定登陆页的链接地址。例如“电子商品”对应的广告组(用户群)可以设置“电子商品”所对应类目的导航页。
再营销流量进入网站登陆页时,内容可能是类目页面或者是关键词搜索页面,该内容取决于访问用户在展示网络上所触发标签(广告)。例如,用户在访问网站埋点网页时会上传该用户的分类标签,因此在广告账户中会有与该用户分类标签对应的广告。当用户在访问展示网络上的广告位置时,会触发某个标签对应的广告,在用户点击广告后进入标签所对应的登陆页。
本实施例中,分类标签所对应的登陆页在反映了用户当前的兴趣点的基础上,进一步考虑用户的历史偏好。即在登陆页加入用户的历史偏好内容,实现个性化,改善用户体验,以达到提高转化和收益的目标。
本实施例中,分析用户历史行为信息得到的特征信息中,业务特征可以包括关键词和类目。然后对用户的偏好关键词和类目集合计算排序分值并进行排序。
其中,i为关键词或类目对应的商品,以商品汇总效果而言关联特征信息包括:view为商品的曝光量,click为商品获得的点击量,order是订单数量。取排序分值由大到小排在前N个的商品词和类目作为候选分类标签。
不同于单一的关键词或类目搜索页面,个性化登陆页面采用了多个关键词和类目进行商品检索。检索的商品集合为所有关键词和类目的并集。
传统的广告排序采用点击率(Click-Through-Rate,CTR)*竞价,即ctr*bid的方式进行,以保证千次展示收入(Revenue Per Mille,RPM)最大化。登录页面中商品的个性化排序可以根据检索关键词和类目的权重对CTR进行修正。
ctri′=γ*Σjscorei,j+ctri 公式10
ctri为商品i的原始ctr,scorei,j为商品i所对应的检索关键词或类目对应的偏好得分,γ为经验参数。
现有登陆页的内容只反映了用户当前的兴趣点,而没有考虑用户历史的兴趣点。本申请实施例在分析用户历史行为数据,挖掘用户更多兴趣点和更精确的用户意图确定分类标签以及用户群的群体价值信息基础上,基于用户的特征信息在登陆页组织更丰富的个性化内容提升用户体验,从而带来更多的平台收益。例如对于某个“电子商品”对应的访问用户,通过历史数据的分析,发现用户对“上衣”也感兴趣,另外发现用户对“电子商品”中的“平板”感兴趣。因此,在登陆页中可以将“平板”相关商品排在前面,“上衣”等其他兴趣可以组织在页面右侧等区域。并且,还可以通过分析用户所在群体的特征确定登陆页面,如基于年龄、区域进行等进行设置。
4.20在搜索引擎中执行标签映射。
4.22用户浏览其他网站的网页时点击触发广告。
4.24返回该广告对应的登陆页。
搜索引擎基于网站上传的gid和tag,完成映射(gid,tag),从而在该用户搜索引擎的展示广告网络被发现时,如在google展示广告网络(Google Display Network,GDN)被发现时,依据映射(gid,tag)触发展示相应的广告。用户在点击某一广告后,基于该广告所对应的链接地址可以开启相应的登陆页面。
本实施中通过用户和分类标签进行映射进行广告的投放,这只是具体实施中的一种方式,还可以采用如对网站用户和再营销平台用户进行映射(cookie mapping)的方式,本实施例对此不作限定。
通过上述交互过程实现了广告投放的预处理,以及广告投放步骤。本实施例可以应用于分布式集群的Linux操作系统上、利用Hadoop和Hive运行较佳的实施效果。
综上,根据用户当前浏览网页和历史行为信息,分析用户的特征信息即兴趣点所在,并从多种维度分析用户购买意图、购买阶段以及购买习惯。通过分析得到的兴趣点、所处购买阶段和真实购买意图对人群进行分类标注确定分类。本实施例在在进行人群分类标注时,不再局限于只使用埋点网页的内容与标题,而是结合用户历史行为信息的分析,对用户提供更多维度的分类标签。
其次,根据再营销流量的特征信息,对用户群的特征信息建模,预估群体价值信息,并根据群体价值信息进行广告组的竞价设置,保证能够达到营收比的条件下获取更多的流量。
再次,分析用户的历史行为信息,得到用户的特征信息从而总结出购买偏好和习惯。利用用户的特征信息对登陆页面的商品进行个性化检索和排序,为用户在访问登陆页面动态生成个性化内容。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
实施例四
在上述实施例的基础上,本实施例还提供了一种信息投放的预处理装置。
参照图5,示出了本申请实施例提供的一种信息投放的预处理装置的结构框图,具体可以包括如下模块:
特征分析模块502,用于在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息。标签分析模块504,用于根据特征信息确定分类标签及其用户群。创建模块506,用于为每个分类标签创建业务对象组。群体价值计算模块508,用于计算特征信息所属分类标签对应用户群的群体价值信息。价值特征设置模块510,用于依据所述群体价值信息设置所述业务对象组的价值特征信息,其中,所述价值特征信息用于确定网页展示位中展示的业务对象组。
综上所述,本实施例通过基于用户的当前访问网页和历史行为信息确定所述用户的特征信息,从而全面、准确地确定用户所具有的特征,再基于各用户的特征信息分析出对应的分类标签,以及该分类标签所对应的用户群,并为每个分类标签创建业务对象组,即可以基于用户当前和历史行为分析出其所对应的业务对象组,从而后续精准的定位推荐的业务对象。并且,还采用特征信息分析其所属分类标签对应用户群的群体价值信息,进而设置业务对象组的价值特征信息,准确的分析每个业务对象组的价值,以在投放广告时依据其价值特征信息准确的确定投放的业务对象,从而通过上述投放的预处理操作,可以在投放广告前准确分析用户所属分类标签并确定对应业务对象组及其价值特征信息,使得后续所投放的业务对象定位更精准,符合用户期望和需求。
实施例五
参照图6A,示出了本申请实施例提供的另一种信息投放的预处理装置的结构框图,具体可以包括如下模块:
特征分析模块602,用于在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息。标签分析模块604,用于根据特征信息确定分类标签及其用户群。创建模块606,用于为每个分类标签创建业务对象组。群体价值计算模块608,用于计算特征信息所属分类标签对应用户群的群体价值信息。价值特征设置模块610,用于依据所述群体价值信息设置所述业务对象组的价值特征信息,其中,所述价值特征信息用于确定网页展示位中展示的业务对象组。登陆页设置模块612,用于根据所述用户的特征信息确定所述用户对应的候选分类标签;按照所述候选分类标签设置所述用户的登陆页面,所述登陆页面为触发所述网页展示位中展示的业务对象所链接到的页面。
参照图6B,示出了本申请实施例提供的另一种信息投放的预处理装置中特征分析模块的结构框图。
其中,所述特征分析模块602,包括:信息获取子模块60202,用于在用户访问网站时,分别获取所述用户的当前访问网页和历史行为信息;分析子模块60204,用于按照一种或多种维度分别对所述当前访问网页和历史行为信息进行分析,确定所述用户的特征信息。
本申请一个可选实施例中,所述分析子模块60204,包括:第一分析单元602042,用于按照文本维度对所述当前访问网页的文本信息进行分析,从所述文本信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信息。
第二分析单元602044,用于按照文本维度对所述历史行为信息中的文本信息进行分析,从所述文本信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信息;和/或,按照时间维度对所述历史行为信息中的时间相关信息进行分析,从所述时间相关信息中提取阶段特征和所述阶段特征的特征值作为用户的特征信息;和/或,按照其他维度对所述历史行为信息中的关联信息进行分析,从所述关联信息中提取地域特征及其特征值,和/或,设备特征及其特征值作为用户的特征信息。
其中,所述第一分析单元602042,还用于针对操作维度,通过对所述用户在当前访问网页内执行的操作信息的分析,提取所述用户的分类特征及其特征值,其中,所述操作信息包括:停留时间数据和动作执行数据。
参照图6C,示出了本申请实施例提供的另一种信息投放的预处理装置中标签分析模块的结构框图。
所述标签分析模块604,包括:标签确定子模块60402,用于获取各用户的特征信息中的特征值,确定各特征值对应匹配的分类标签,其中,每个分类标签对应一个或多个特征值;用户群圈定子模块60404,用于针对每个分类标签,通过特征值圈定所述分类标签对应的用户构成用户群。
参照图6D,示出了本申请实施例提供的另一种信息投放的预处理装置中群体价值计算模块的结构框图。
所述群体价值计算模块608,包括:权重训练子模块60802,用于对第一时间段内各用户的特征信息进行特征分析,确定用户群的价值权重;价值预估子模块60804,用于对第二时间段内各用户的特征信息进行特征分析,并通过所述价值权重的加权计算确定所述用户群的群体价值信息。
本申请一个可选实施例中,所述权重训练子模块60802,包括:切分单元608022,用于对所述第一时间段进行切分,确定训练时间段和测试时间段;特征分析单元608024,用于对所述训练时间段内各用户的特征信息进行特征分析确定特征矩阵;抽取单元608026,用于从所述测试时间段内各用户的特征信息中抽取训练目标;训练单元608028,用于对所述特征矩阵和训练目标进行回归训练,计算所述用户群的价值权重。
所述价值预估子模块60804,包括:特征预测单元608042,用于对第二时间段内各用户的特征信息进行特征分析确定预测的特征矩阵;价值计算单元608044,用于采用所述价值权重对所述预测的特征矩阵进行加权,计算确定所述用户群的群体价值信息。
所述价值特征设置模块610,用于通过预设的目标价值信息和所述用户群的群体价值信息,计算所述业务对象组的价值特征信息。
参照图6E,示出了本申请实施例提供的另一种信息投放的预处理装置中登陆页设置模块的结构框图。
本申请一个可选实施例中,所述登陆页设置模块612,包括:第一筛选子模块61202,用于从所述用户访问网站的数据库中筛选所述用户的业务特征的特征值对应关联特征信息;分值计算子模块61204,用于按照所述关联特征信息计算每个业务特征的特征值的排序分值;特征值排序子模块61206,用于按照所述排序分值对所述用户的业务特征的特征值进行排序,确定排序结果;第二筛选子模块61208,用于从所述排序结果中筛选前N个业务特征的特征值,将筛选的特征值对应分类标签作为特征分类标签。
检索模块61210,用于按照所述候选分类标签确定检索关键词对目标对象进行检索,获取检索到的目标对象;修正模块61212,用于按照所述候选分类标签的排序分值,对所述检索到的目标对象的点击数据进行修正;目标对象排序子模块61214,用于按照修正的点击数据对所述检索到的目标对象进行排序;页面生成子模块61216,用于依据排序结果生成包含所述检索到的目标对象的登录页面。
综上,可以通过文本维度、时间维度、操作维度以及其他维度等一种或多种维度分别对用户的当前访问网页和历史行为信息进行分析,从而获取与该维度相关的特征及其特征值构成特征信息,通过多维分析得到的特征信息更加全面、准确。
其次,基于各用户的特征信息,确定每个特征值对应匹配的分类标签,进而圈定每个分类标签的用户群,确定具有该分类标签的用户群体,得到用户的群体特征。
再次,可以通过模型训练等方式对特征信息进行特征分析确定用户群的价值权重,从而基于预测前的第二时间段内用户的特征信息分析该用户群的群体价值信息,基于用户的行为能够得到更准确的群体价值信息,继而计算所述业务对象组准确的价值特征信息,准确的该价值特征信息能够提高业务对象的投放准确性,使得投放符合用户预期,得到更好的推荐效果。
再次,根据用户历史行为分析出的特征信息选取排序分支较高的候选分类标签,从而基于该候选分类标签检索目标对象生成所述用户的登陆页面,使得用户在触发业务对象时不仅展示与该业务对象相关的目标对象,还显示该用户可能感兴趣的其他目标对象,使得推荐更加全面。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序商品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序商品的形式。
在一个典型的配置中,所述计算机设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非持续性的电脑可读媒体(transitory media),如调制的数据信号和载波。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序商品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种信息投放的预处理方法和一种信息投放的预处理装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (24)
1.一种信息投放的预处理方法,其特征在于,包括:
在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息;
根据所述特征信息确定分类标签及其用户群,为每个分类标签创建业务对象组,所述业务对象组包括具有相同特征的业务对象的集合;
计算特征信息所属分类标签对应用户群的群体价值信息;
依据所述群体价值信息设置所述业务对象组的价值特征信息,其中,所述价值特征信息用于确定网页展示位中展示的业务对象组;
其中,所述根据所述特征信息确定分类标签及其用户群,包括:获取各用户的特征信息中的特征值,确定各特征值对应匹配的分类标签,其中,每个分类标签对应一个或多个特征值;针对每个分类标签,通过特征值圈定所述分类标签对应的用户构成用户群。
2.根据权利要求1所述的方法,其特征在于,在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息,包括:
在用户访问网站时,分别获取所述用户的当前访问网页和历史行为信息;
按照一种或多种维度分别对所述当前访问网页和历史行为信息进行分析,确定所述用户的特征信息。
3.根据权利要求2所述的方法,其特征在于,对所述当前访问网页进行分析确定所述用户的特征信息的步骤,包括:
按照文本维度对所述当前访问网页的文本信息进行分析,从所述文本信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信息。
4.根据权利要求2所述的方法,其特征在于,对所述历史行为信息进行分析确定所述用户的特征信息的步骤包括以下至少一项:
按照文本维度对所述历史行为信息中的文本信息进行分析,从所述文本信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信息;
按照时间维度对所述历史行为信息中的时间相关信息进行分析,从所述时间相关信息中提取阶段特征和所述阶段特征的特征值作为用户的特征信息;
按照其他维度对所述历史行为信息中的关联信息进行分析,从所述关联信息中提取地域特征及其特征值,和/或,设备特征及其特征值作为用户的特征信息。
5.根据权利要求3所述的方法,其特征在于,对所述当前访问网页进行分析确定所述用户的特征信息的步骤还包括:
针对操作维度,通过对所述用户在当前访问网页内执行的操作信息的分析,提取所述用户的分类特征及其特征值,其中,所述操作信息包括:停留时间数据和动作执行数据。
6.根据权利要求1至5任一项所述的方法,其特征在于,计算特征信息所属分类标签对应用户群的群体价值信息,包括:
对第一时间段内各用户的特征信息进行特征分析,确定用户群的价值权重;
对第二时间段内各用户的特征信息进行特征分析,并通过所述价值权重的加权计算确定所述用户群的群体价值信息。
7.根据权利要求6所述的方法,其特征在于,所述对第一时间段内各用户的特征信息进行特征分析,确定用户群的价值权重,包括:
对所述第一时间段进行切分,确定训练时间段和测试时间段;
对所述训练时间段内各用户的特征信息进行特征分析确定特征矩阵;
从所述测试时间段内各用户的特征信息中抽取训练目标;
对所述特征矩阵和训练目标进行回归训练,计算所述用户群的价值权重。
8.根据权利要求6所述的方法,其特征在于,对第二时间段内各用户的特征信息进行特征分析,并通过所述价值权重的加权计算确定所述用户群的群体价值信息,包括:
对第二时间段内各用户的特征信息进行特征分析确定预测的特征矩阵;
采用所述价值权重对所述预测的特征矩阵进行加权,计算确定所述用户群的群体价值信息。
9.根据权利要求8所述的方法,其特征在于,依据所述群体价值信息设置所述业务对象组的价值特征信息,包括:
通过预设的目标价值信息和所述用户群的群体价值信息,计算所述业务对象组的价值特征信息。
10.根据权利要求3或4所述的方法,其特征在于,还包括:
根据所述用户的特征信息确定所述用户对应的候选分类标签;
按照所述候选分类标签设置所述用户的登陆页面,所述登陆页面为触发所述网页展示位中展示的业务对象所链接到的页面。
11.根据权利要求10所述的方法,其特征在于,根据所述用户的特征信息确定所述用户对应的候选分类标签,包括:
从所述用户访问网站的数据库中筛选所述用户的业务特征的特征值对应关联特征信息;
按照所述关联特征信息计算每个业务特征的特征值的排序分值;
按照所述排序分值对所述用户的业务特征的特征值进行排序,确定排序结果;
从所述排序结果中筛选前N个业务特征的特征值,将筛选的特征值对应分类标签作为特征分类标签。
12.根据权利要求11所述的方法,其特征在于,按照所述候选分类标签设置所述用户的登陆页面,包括:
按照所述候选分类标签确定检索关键词对目标对象进行检索,获取检索到的目标对象;
按照所述候选分类标签的排序分值,对所述检索到的目标对象的点击数据进行修正;
按照修正的点击数据对所述检索到的目标对象进行排序;
依据排序结果生成包含所述检索到的目标对象的登录页面。
13.一种信息投放的预处理装置,其特征在于,包括:
特征分析模块,用于在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息;
标签分析模块,用于根据所述特征信息确定分类标签及其用户群;
创建模块,用于为每个分类标签创建业务对象组,所述业务对象组包括具有相同特征的业务对象的集合;
群体价值计算模块,用于计算特征信息所属分类标签对应用户群的群体价值信息;
价值特征设置模块,用于依据所述群体价值信息设置所述业务对象组的价值特征信息,其中,所述价值特征信息用于确定网页展示位中展示的业务对象组;
所述标签分析模块,包括:
标签确定子模块,用于获取各用户的特征信息中的特征值,确定各特征值对应匹配的分类标签,其中,每个分类标签对应一个或多个特征值;
用户群圈定子模块,用于针对每个分类标签,通过特征值圈定所述分类标签对应的用户构成用户群。
14.根据权利要求13所述的装置,其特征在于,所述特征分析模块,包括:
信息获取子模块,用于在用户访问网站时,分别获取所述用户的当前访问网页和历史行为信息;
分析子模块,用于按照一种或多种维度分别对所述当前访问网页和历史行为信息进行分析,确定所述用户的特征信息。
15.根据权利要求14所述的装置,其特征在于,所述分析子模块,包括:
第一分析单元,用于按照文本维度对所述当前访问网页的文本信息进行分析,从所述文本信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信息。
16.根据权利要求14所述的装置,其特征在于,所述分析子模块,包括:
第二分析单元,用于按照文本维度对所述历史行为信息中的文本信息进行分析,从所述文本信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信息;和/或,按照时间维度对所述历史行为信息中的时间相关信息进行分析,从所述时间相关信息中提取阶段特征和所述阶段特征的特征值作为用户的特征信息;和/或,按照其他维度对所述历史行为信息中的关联信息进行分析,从所述关联信息中提取地域特征及其特征值,和/或,设备特征及其特征值作为用户的特征信息。
17.根据权利要求15所述的装置,其特征在于,
所述第一分析单元,还用于针对操作维度,通过对所述用户在当前访问网页内执行的操作信息的分析,提取所述用户的分类特征及其特征值,其中,所述操作信息包括:停留时间数据和动作执行数据。
18.根据权利要求13至17任一项所述的装置法,其特征在于,所述群体价值计算模块,包括:
权重训练子模块,用于对第一时间段内各用户的特征信息进行特征分析,确定用户群的价值权重;
价值预估子模块,用于对第二时间段内各用户的特征信息进行特征分析,并通过所述价值权重的加权计算确定所述用户群的群体价值信息。
19.根据权利要求18所述的装置,其特征在于,所述权重训练子模块,包括:
切分单元,用于对所述第一时间段进行切分,确定训练时间段和测试时间段;
特征分析单元,用于对所述训练时间段内各用户的特征信息进行特征分析确定特征矩阵;
抽取单元,用于从所述测试时间段内各用户的特征信息中抽取训练目标;
训练单元,用于对所述特征矩阵和训练目标进行回归训练,计算所述用户群的价值权重。
20.根据权利要求18所述的装置,其特征在于,所述价值预估子模块,包括:
特征预测单元,用于对第二时间段内各用户的特征信息进行特征分析确定预测的特征矩阵;
价值计算单元,用于采用所述价值权重对所述预测的特征矩阵进行加权,计算确定所述用户群的群体价值信息。
21.根据权利要求20所述的装置,其特征在于,
所述价值特征设置模块,用于通过预设的目标价值信息和所述用户群的群体价值信息,计算所述业务对象组的价值特征信息。
22.根据权利要求15或16所述的装置,其特征在于,还包括:
登陆页设置模块,用于根据所述用户的特征信息确定所述用户对应的候选分类标签;按照所述候选分类标签设置所述用户的登陆页面,所述登陆页面为触发所述网页展示位中展示的业务对象所链接到的页面。
23.根据权利要求22所述的装置,其特征在于,所述登陆页设置模块,包括:
第一筛选子模块,用于从所述用户访问网站的数据库中筛选所述用户的业务特征的特征值对应关联特征信息;
分值计算子模块,用于按照所述关联特征信息计算每个业务特征的特征值的排序分值;
特征值排序子模块,用于按照所述排序分值对所述用户的业务特征的特征值进行排序,确定排序结果;
第二筛选子模块,用于从所述排序结果中筛选前N个业务特征的特征值,将筛选的特征值对应分类标签作为特征分类标签。
24.根据权利要求23所述的装置,其特征在于,所述登陆页设置模块,包括:
检索模块,用于按照所述候选分类标签确定检索关键词对目标对象进行检索,获取检索到的目标对象;
修正模块,用于按照所述候选分类标签的排序分值,对所述检索到的目标对象的点击数据进行修正;
目标对象排序子模块,用于按照修正的点击数据对所述检索到的目标对象进行排序;
页面生成子模块,用于依据排序结果生成包含所述检索到的目标对象的登录页面。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510041351.1A CN105989004B (zh) | 2015-01-27 | 2015-01-27 | 一种信息投放的预处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510041351.1A CN105989004B (zh) | 2015-01-27 | 2015-01-27 | 一种信息投放的预处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105989004A CN105989004A (zh) | 2016-10-05 |
CN105989004B true CN105989004B (zh) | 2020-04-14 |
Family
ID=57035594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510041351.1A Active CN105989004B (zh) | 2015-01-27 | 2015-01-27 | 一种信息投放的预处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105989004B (zh) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108062679A (zh) * | 2016-11-08 | 2018-05-22 | 北京国双科技有限公司 | 确定用户价值的方法及装置 |
CN106530015B (zh) * | 2016-12-08 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 信息投放控制方法及装置 |
CN106875087A (zh) * | 2016-12-30 | 2017-06-20 | 厦门南讯软件科技有限公司 | 一种待付款订单转化可行性分析方法 |
CN106803190A (zh) * | 2017-01-03 | 2017-06-06 | 北京掌阔移动传媒科技有限公司 | 一种广告个性化推送系统及方法 |
CN106909629B (zh) * | 2017-01-26 | 2020-05-19 | 武汉奇米网络科技有限公司 | 一种个性化推荐坑位标签的方法及系统 |
CN107087017B (zh) | 2017-03-09 | 2020-02-21 | 阿里巴巴集团控股有限公司 | 一种业务引流的方法和装置 |
CN107145508B (zh) * | 2017-03-23 | 2020-06-05 | 广州要啦网络有限公司 | 网站数据处理方法、装置及系统 |
CN108734500A (zh) * | 2017-04-25 | 2018-11-02 | 百度在线网络技术(北京)有限公司 | 信息投放方法、装置、设备及存储介质 |
CN107193972A (zh) * | 2017-05-25 | 2017-09-22 | 山东浪潮云服务信息科技有限公司 | 一种基于大数据的分类用户方法及装置 |
CN109388739A (zh) * | 2017-08-03 | 2019-02-26 | 合信息技术(北京)有限公司 | 多媒体资源的推荐方法及装置 |
CN107577736B (zh) * | 2017-08-25 | 2021-12-17 | 武汉数字智能信息科技有限公司 | 一种基于bp神经网络的文件推荐方法及系统 |
CN107590691B (zh) * | 2017-09-06 | 2021-01-15 | 晶赞广告(上海)有限公司 | 一种信息发布方法及装置、存储介质、终端 |
CN110147514B (zh) * | 2017-09-08 | 2023-11-07 | 阿里巴巴集团控股有限公司 | 一种资源展示方法、装置及其设备 |
CN108235126B (zh) * | 2017-12-15 | 2020-03-27 | 北京小度互娱科技有限公司 | 在视频中插入推荐信息的方法和装置 |
CN108197219A (zh) * | 2017-12-28 | 2018-06-22 | 北京奇虎科技有限公司 | 推送信息的方法及装置 |
CN108563670B (zh) * | 2018-01-12 | 2021-04-27 | 武汉斗鱼网络科技有限公司 | 视频推荐方法、装置、服务器及计算机可读存储介质 |
CN110109901B (zh) * | 2018-02-02 | 2024-05-24 | 北京京东尚科信息技术有限公司 | 筛选目标对象的方法和装置 |
CN110688560A (zh) * | 2018-06-19 | 2020-01-14 | 阿里巴巴集团控股有限公司 | 一种信息推荐的方法和装置 |
CN110766493B (zh) * | 2018-07-26 | 2023-04-28 | 阿里巴巴集团控股有限公司 | 业务对象提供方法、服务器、电子设备、存储介质 |
CN110796465B (zh) * | 2018-08-03 | 2023-08-01 | 阿里巴巴集团控股有限公司 | 资源展示设备确定方法、广告展示屏幕确定方法及装置 |
CN109284500A (zh) * | 2018-08-20 | 2019-01-29 | 张连祥 | 基于招商工作流程和阅读偏好的信息推送系统及方法 |
CN110969473B (zh) * | 2018-09-30 | 2023-10-31 | 北京国双科技有限公司 | 一种用户标签生成方法及装置 |
CN109523301B (zh) * | 2018-10-19 | 2023-11-07 | 中国平安人寿保险股份有限公司 | 产品交易数据处理方法、装置、计算机设备和存储介质 |
CN109657965A (zh) * | 2018-12-13 | 2019-04-19 | 上海安吉星信息服务有限公司 | 一种服务资源分配方法、装置、存储介质及处理器 |
CN110288379A (zh) * | 2019-05-28 | 2019-09-27 | 北京深演智能科技股份有限公司 | 广告的转化价格预测方法、装置、存储介质及计算机设备 |
CN110197402B (zh) * | 2019-06-05 | 2022-07-15 | 中国联合网络通信集团有限公司 | 基于用户群的用户标签分析方法、装置、设备和存储介质 |
CN110351343A (zh) * | 2019-06-21 | 2019-10-18 | 北京纵横无双科技有限公司 | 一种基于大数据分析的信息精准推送方法及装置 |
CN110288443A (zh) * | 2019-06-27 | 2019-09-27 | 北京金山安全软件有限公司 | 信息推送方法、装置、电子设备及计算机可读存储介质 |
CN110348894B (zh) * | 2019-06-29 | 2023-09-26 | 上海淇馥信息技术有限公司 | 资源位广告展示的方法、装置及电子设备 |
CN110347929B (zh) * | 2019-07-17 | 2023-03-03 | 重庆高开清芯科技产业发展有限公司 | 一种基于用户需求特征的智能推送方法及推送系统 |
CN110675217A (zh) * | 2019-09-05 | 2020-01-10 | 广州亚美信息科技有限公司 | 个性化背景图生成方法及装置 |
CN110704706B (zh) * | 2019-09-11 | 2021-09-03 | 北京海益同展信息科技有限公司 | 分类模型的训练方法、分类方法及相关设备、分类系统 |
CN110585726B (zh) * | 2019-09-16 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 用户召回方法、装置、服务器及计算机可读存储介质 |
CN110910201B (zh) * | 2019-10-18 | 2023-08-29 | 中国平安人寿保险股份有限公司 | 信息推荐的控制方法、装置、计算机设备及存储介质 |
CN110930189A (zh) * | 2019-11-20 | 2020-03-27 | 深圳市豪斯莱科技有限公司 | 基于用户行为的个性化营销方法 |
CN111179101A (zh) * | 2019-12-13 | 2020-05-19 | 广西职业技术学院 | 一种基于共享网络的互联网保险营销数据处理系统 |
CN113159809B (zh) * | 2020-01-22 | 2022-06-14 | 阿里巴巴集团控股有限公司 | 对象处理方法、装置、电子设备及计算机可读存储介质 |
CN111324800B (zh) * | 2020-02-12 | 2023-04-21 | 腾讯科技(深圳)有限公司 | 业务事项展示方法、装置和计算机可读存储介质 |
CN111737305B (zh) * | 2020-05-27 | 2024-03-15 | 上海晶赞融宣科技有限公司 | 信息推送中人群特征确定方法及装置、可读存储介质 |
CN112184333A (zh) * | 2020-10-27 | 2021-01-05 | 杭州推啊网络科技有限公司 | 一种广告标题的自动投放方法 |
CN112508284A (zh) * | 2020-12-10 | 2021-03-16 | 网易(杭州)网络有限公司 | 展示物料预处理方法、投放方法、系统、装置与设备 |
CN113095872A (zh) * | 2021-03-23 | 2021-07-09 | 上海嵩恒网络科技股份有限公司 | 广告用户的分析方法、系统、电子设备和存储介质 |
CN112907301B (zh) * | 2021-03-29 | 2022-06-14 | 哈尔滨工业大学 | 一种基于Bi-LSTM-CRF模型的内容相关广告投放方法及系统 |
CN117150143B (zh) * | 2023-10-30 | 2024-01-26 | 华能信息技术有限公司 | 一种基于工业互联网平台的服务方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101166130B1 (ko) * | 2007-08-30 | 2012-07-23 | 삼성전자주식회사 | 컨텐츠 태그를 이용하여 사용자 프로파일을 구성하는 방법및 장치, 그리고 생성된 사용자 프로파일을 이용하여컨텐츠를 추천하는 방법 |
CN101685521A (zh) * | 2008-09-23 | 2010-03-31 | 北京搜狗科技发展有限公司 | 在网页中展现广告的方法及系统 |
CN101511055B (zh) * | 2009-02-19 | 2011-08-24 | 华为技术有限公司 | 广告的投放方法及装置 |
CN102346899A (zh) * | 2011-10-08 | 2012-02-08 | 亿赞普(北京)科技有限公司 | 一种基于用户行为的广告点击率预测方法和装置 |
CN103177384A (zh) * | 2013-04-16 | 2013-06-26 | 高鹏 | 基于用户兴趣图谱的网络广告投放方法 |
-
2015
- 2015-01-27 CN CN201510041351.1A patent/CN105989004B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN105989004A (zh) | 2016-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105989004B (zh) | 一种信息投放的预处理方法和装置 | |
CN105765573B (zh) | 网站通信量优化方面的改进 | |
KR101511050B1 (ko) | 상품 정보를 제공하고 표시하는 방법, 장치, 시스템 및 컴퓨터 프로그램 | |
US9576251B2 (en) | Method and system for processing web activity data | |
US9348935B2 (en) | Systems and methods for augmenting a keyword of a web page with video content | |
KR101419504B1 (ko) | 사용자 성향 분석을 통한 맞춤형 쇼핑 정보 제공 시스템 및 방법 | |
US20160132935A1 (en) | Systems, methods, and apparatus for flexible extension of an audience segment | |
CN106557480B (zh) | 查询改写的实现方法及装置 | |
US20080243797A1 (en) | Method and system of selecting landing page for keyword advertisement | |
CN112200601B (zh) | 物品推荐方法、装置及可读存储介质 | |
CN105469263A (zh) | 一种商品推荐方法及装置 | |
CA3070612A1 (en) | Click rate estimation | |
CN107153656B (zh) | 一种信息搜索方法和装置 | |
CN104679771A (zh) | 一种个性化数据搜索方法和装置 | |
CN107633416B (zh) | 一种业务对象的推荐方法、装置和系统 | |
WO2015148393A1 (en) | Data search processing | |
US9330071B1 (en) | Tag merging | |
CN106126544B (zh) | 一种互联网内容的投放方法及装置 | |
KR20180052489A (ko) | 사용자 경험분석 및 환경요인에 기초한 크로스보더 전자상거래 상품 추천 방법 | |
WO2022095701A1 (zh) | 一种对象推荐方法及装置、设备、存储介质 | |
CN113837842A (zh) | 一种基于用户行为数据的商品推荐方法及设备 | |
CN112148973A (zh) | 一种信息推送的数据处理方法及装置 | |
CN111680213B (zh) | 信息推荐方法、数据处理方法及装置 | |
CN108229990B (zh) | 一种广告标题生成方法、装置和设备 | |
Bucklin et al. | Marketing models for internet advertising |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240228 Address after: 51 Belarusian Road, Singapore Patentee after: Alibaba Singapore Holdings Ltd. Country or region after: Singapore Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands Patentee before: ALIBABA GROUP HOLDING Ltd. Country or region before: Cayman Islands |