CN103425680B - 页面展示广告的选取方法和系统 - Google Patents

页面展示广告的选取方法和系统 Download PDF

Info

Publication number
CN103425680B
CN103425680B CN201210157360.3A CN201210157360A CN103425680B CN 103425680 B CN103425680 B CN 103425680B CN 201210157360 A CN201210157360 A CN 201210157360A CN 103425680 B CN103425680 B CN 103425680B
Authority
CN
China
Prior art keywords
advertisement
keyword
target keyword
page
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210157360.3A
Other languages
English (en)
Other versions
CN103425680A (zh
Inventor
张涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210157360.3A priority Critical patent/CN103425680B/zh
Publication of CN103425680A publication Critical patent/CN103425680A/zh
Application granted granted Critical
Publication of CN103425680B publication Critical patent/CN103425680B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请提供了一种页面展示广告的选取方法,包括:获取当前页面的关键词;对所述关键词进行过滤,得到目标关键词;确定各目标关键词与当前页面的关联度;基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告。本申请还提供了一种实现前述方法的页面展示广告的选取系统。本申请的页面展示广告的选取方法及系统,能够在对于页面文本内容较少的页面进行展示广告的选取时提高选取准确性以及降低计算复杂度。

Description

页面展示广告的选取方法和系统
技术领域
本申请涉及计算机网络数据处理技术领域,特别是涉及一种页面展示广告的选取方法及系统。
背景技术
一般来说网站(站内)的潜在收益与访问流量成正比,因此,网站会通过多种方式来提高访问流量。在其他网站进行广告投放便是其中一种方式,将在其他网站访问的用户通过点击广告引入到网站内。
在实际广告投放中,往往会遇到基于页面分析的广告投放场景。例如,对于一个用户正在阅读的页面,在页面的右侧推荐相关的广告。这个时候就需要一个方法分析页面的内容,并根据分析的内容选取相应的广告进行投放,目标是平衡投放广告收益与用户体验,使得两者达到共同的最大化或者使得单独某一项最大化。
在实现前述广告投放时,可以对页面进行内容分析,提取其中的所有关键词,并按照一定的方法计算出所有关键词分数,组成关键词向量,然后再通过每一个关键词获取该关键词所对应的广告以及每个广告的出价,最后计算关键词向量中每个关键词分数与每个广告的相关性分数,利用相关性分数与每个广告的出价来计算广告的排序分数,并按照排序分数对广告进行排序得到需要在页面进行展示的广告。
前述方法中,适用于页面中所包含的文字内容较多的页面,因为文字内容较多的页面往往用少数的关键词无法准确的表示其主题,所以需要通过计算每个关键词与每个广告的相关性分数的方式来对所有广告进行排序,然后选取需要展示的广告,以保证选取的广告与当前页面的关联性。在这个过程中,因为所涉及的关键词以及广告数量较多,且每个关键词与每个广告都需要计算相关性,这无疑会增加计算量,从而增加了系统展示广告的计算时间,降低了展示广告的反应速度。
另外,对于包含文字内容较少的页面来说,特别是画报页面,即以图片为主的页面,例如购物网站中商品图片展示页面,因为其主题较为明确,往往通过极少的关键词便可以表示出页面主题,此时,若仍然采用前述方法,除了会增加不必要的计算,甚至还会影响最后选取广告与当前页面的相关性。因为每个关键词与其所对应的广告都会具有较高的相关性,即使与当前页面主题不太相关的关键词,其对应的广告的排序分数也可能会较高,这就会影响可以表示页面主题的关键词所对应的广告的排序。例如对于一个画报页面来说,其主要展示的图片内容是女装,但是可以提取的关键词可能包括春季、女装、韩版、欧美版等等,每个关键词都会有对应的广告,此时若按照前述方法来计算每个关键词所对应广告的排序分数,那么就可能出现春季所对应的广告的排序分数与女装所对应的广告的排序分数差不多。那么选取的展示广告中便会有部分为春季这个关键词所对应的广告,而对于该画报页面来说,其主要想展示的广告应该优选为女装所对应的广告。因为此种方式无疑会影响最后选取的展示广告准确性,同时增加了计算复杂度和计算量。
发明内容
本申请所要解决的技术问题是提供一种页面展示广告的选取方法及系统,能够解决对于页面文本内容较少的页面进行展示广告的选取时选取准确性以及计算复杂度的问题。
为了解决上述问题,本申请公开了一种页面展示广告的选取方法,包括:
获取当前页面的关键词;
对所述关键词进行过滤,得到目标关键词;
确定各目标关键词与当前页面的关联度;
基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告。
进一步地,所述获取当前页面的关键词包括:
抓取当前页面内容;
提取当前页面内容中的文本内容;
将所述文本内容传入服务器,按照预定规则进行切分,得到当前页面的关键词。
进一步地,对所述关键词进行过滤包括:
查询产品词字典,若关键词不在所述产品词字典中,则过滤该关键词,反之,则保留该关键词。
进一步地,所述确定各目标关键词与当前页面的关联度包括:
确定目标关键词与当前页面的相关性分数,根据所述相关性分数确定各目标关键词与当前页面的关联度。
进一步地,所述确定目标关键词与当前页面的相关性分数包括:
统计当前目标关键词在当前页面出现的次数以及在当前应用场景的所有页面中出现的次数;
统计当前页面中所有目标关键词出现次数的总和;
统计当前应用场景的所有页面的数目;
基于前述步骤中所获取的参数计算目标关键词与当前页面的相关性分数。
进一步地,所述确定各目标关键词与当前页面的关联度包括:
确定目标关键词对网站收益的影响值;
确定目标关键词与当前页面的相关性分数;
基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度。
进一步地,所述确定目标关键词对网站收益的影响值包括:
统计预定时间内当前目标关键词在投放之后为网站带来的收益总和;
统计相同时间内当前目标关键词被投放的次数;
根据所述收益总和和被投放的次数确定当前目标关键词对网站收益的影响值。
进一步地,所述基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度包括:
确定影响值的权重值;
确定相关性分数的权重值;
基于所述目标关键词的影响值、相关性分数以及二者的权重值计算各目标关键词与当前页面的关联度。
进一步地,所述基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告包括:
按照各目标关键词与当前页面的关联度从大到小的顺序每次选取一个目标关键词;
从当前选取的目标关键词所对应的广告集合中选取需要展示的广告;
判断选取的广告数量是否达到预定数量,若否,则选取下一目标关键词,并重复上一步骤继续选取广告。
进一步地,所述基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告包括:
T1,按照各目标关键词与当前页面的关联度的大小对目标关键词进行排序;
T2,按照目标关键词排序的先后顺序选取一个目标关键词,并获取该目标关键词所对应的广告集合;
T3,获取并比较当前广告集合中的广告数量和当前页面广告展示位剩余数量,若广告数量小于剩余数量,则进行步骤T4,反之,则进行步骤T5;
T4,选取当前广告集合中所有的广告作为需要展示的广告,并选取下一目标关键词以及获取该目标关键词所对应的广告集合,返回步骤T3;
T5,对当前广告集合中的广告进行排序,按照排序的先后顺序选取数量等于剩余数量的广告作为需要展示的广告。
进一步地,所述对当前广告集合中的广告进行排序包括:
计算各广告与对应的目标关键词的相关性分数;
获取各广告对应的广告主的出价;
根据所述相关性分数与出价计算各广告的排序分数,按照排序分数的大小对各广告进行排序。
进一步地,所述方法还包括:
展示所有被选取广告,所述展示所有被选取广告包括随机展示或者对所有被选取广告排序后展示。
为了解决上述问题,本申请还公开了一种页面展示广告的选取系统,包括:
当前页面信息获取模块,用于获取当前页面的关键词;
过滤模块,用于对所述关键词进行过滤,得到目标关键词;
关联度计算模块,用于确定所述各目标关键词与当前页面的关联度;
广告选取模块,用于基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告。
进一步地,所述当前页面信息获取模块包括:
页面内容抓取单元,用于抓取当前页面内容;
文本内容提取单元,用于提取当前页面内容中的文本内容;
切分单元,用于将所述文本内容传入服务器,按照预定规则进行切分,得到当前页面的关键词。
进一步地,所述过滤模块包括:
查询单元,用于查询产品词字典,若关键词不在所述产品词字典中,则过滤该关键词,反之,则保留该关键词。
进一步地,所述关联度计算模块包括:
相关性分数确定单元,用于确定目标关键词与当前页面的相关性分数。
进一步地,所述关联度计算模块包括:
影响值确定单元,用于确定目标关键词对网站收益的影响值;
相关性分数确定单元,用于确定目标关键词与当前页面的相关性分数;
计算单元,用于基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度。
进一步地,所述广告选取模块包括:
目标关键词选取单元,用于按照各目标关键词与当前页面的关联度从大到小的顺序每次选取一个目标关键词;
广告选取单元,用于从当前选取的目标关键词所对应的广告集合中选取需要展示的广告;
判断单元,用于判断选取的广告数量是否达到预定数量,若否,则选取下一目标关键词,并触发广告选取单元继续选取广告。
进一步地,所述广告选取模块包括:
目标关键词排序单元,用于按照各目标关键词与当前页面的关联度的大小对目标关键词进行排序;
目标关键词选取单元,用于按照目标关键词排序的先后顺序选取一个目标关键词,并获取该目标关键词所对应的广告集合;
比较单元,用于获取并比较当前广告集合中的广告数量和当前页面广告展示位剩余数量,若广告数量小于剩余数量,则触发广告选取单元,反之,则触发广告排序单元;
广告选取单元,用于选取当前广告集合中所有的广告作为需要展示的广告,并选取下一目标关键词以及获取该目标关键词所对应的广告集合,触发比较单元;
广告排序单元,用于对当前广告集合中的广告进行排序,按照排序的先后顺序选取数量等于剩余数量的广告作为需要展示的广告。
进一步地,所述系统还包括:
展示模块,用于展示所有被选取广告,所述展示所有被选取广告包括随机展示或者对所有被选取广告排序后展示。
与现有技术相比,本申请包括以下优点:
本申请的页面展示广告的选取方法及系统中,通过对画报页面的关键词进行过滤得到目标关键词,并确定目标关键词与页面的关联度,最后基于目标关键词与页面的关联度来确定所需要选取的广告。在这个过程中,通过确定目标关键词与页面的关联度来确定目标关键词是否能够代表当前画报页面的主题,并以此作为选取广告的重要指标,从而可以保证所选取的广告能够与当前画报页面的主题具有较好的相关性,保证了广告选取的客观性。同时,因为画报页面的主题较为明确,无需将所有关键词与所有广告都进行相关性计算,只需要考虑能够表示主题的关键词与其对应的广告的相关性等参数的计算即可,减少了计算复杂度以及计算量,从而可以快速的选取出较为客观准确的广告。
另外,在进行广告选取时,按照目标关键词与当前页面的关联度的大小逐个选取,每次只需要计算当前选取的目标关键词所对应的广告集合中的广告的排序分数,减少了不必要的计算过程,节省了计算时间,降低了计算复杂度。
当然,实施本申请的任一产品不一定需要同时达到以上所述的所有优点。
附图说明
图1是本申请的页面展示广告的选取系统架构图;
图2是本申请的页面展示广告的选取方法实施例一的流程图;
图3是本申请的页面展示广告的选取方法实施例二的流程图;
图4是本申请的页面展示广告的选取系统实施例一的结构示意图;
图5是本申请的页面展示广告的选取系统实施例二的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请的页面展示广告的选取方法及系统主要用于画报页面(以图片为主,文字内容较少的页面)中,通过对画报页面中的关键词进行提取以及关键词与当前画报页面的关联度的计算,并依照关键词与当前画报页面的关联度分数的高低来选取需要在当前画报页面中展示的广告。
参照图1,示出实现本申请的页面展示广告的选取系统架构图,页面展示广告的选取系统为服务器中的一个功能模块,并作为一个中介平台在服务器后台处理系统和前台显示系统之间进行实时判断,从而实现页面展示广告的实时选取并展示。首先,页面展示广告的选取系统从服务器后台处理装置中获取当前页面的关键词以及其历史投放数据等相关数据,历史投放数据具体包括关键词被投放的次数以及为网站所带来的收益。然后,结合这些历史投放数据来确定各关键词与当前页面的关联度,从而选取出能够表示当前页面主题的关键词,然后根据关键词与当前页面的关联度大小来选取对应的广告,并传递给前台显示系统在页面中进行展示。
下面对本申请的页面展示广告的选取方法及系统进行详细的说明。
参照图2,示出本申请的一种页面展示广告的选取方法实施例一,包括以下步骤:
步骤101,获取当前页面的关键词。
获取当前页面的关键词包括:
抓取当前页面内容;
提取当前页面内容中的文本内容;
将所述文本内容传入服务器,按照预定规则进行切分,得到当前页面的关键词。
服务器后台处理系统中预先设置有对文本内容切分的规则及方法,当接收到新传入的文本内容后,便会自动根据文本内容切分规则及方法对文本内容进行切分,得到关键词。
步骤102,对所述关键词进行过滤,得到目标关键词。
对关键词进行过滤包括:查询产品词字典,若关键词不在所述产品词字典中,则过滤该关键词,反之,则保留该关键词。
其中,产品词字典为预先搜集和设定,并存储在服务器中,当需要时,直接查询读取即可。
可以理解,还可以对画报页面进行应用场景区分,并为每个应用场景确定一个产品词字典,在不同的画报应用场景下,需要过滤掉的关键词并不相同。在这种情况下,在确定一个画报页面需要展示的广告时,首先选取该页面的应用场景,从而实现具有针对性的过滤,使最终选取的广告更为准确。例如:在某个商业应用场景中,即画报页面主要以出售物品为主,对于这样的画报页面,在获取了页面的关键词之后,其中的非产品词将直接被过滤。具体的,产品词的定义为:能够单独描述某个确定物品的关键词,例如:手机、电脑,非产品词例如:红色、批发。
步骤103,确定各目标关键词与当前页面的关联度。
目标关键词与当前页面的关联度的确定过程根据实际需要来确定,即,计算目标关键词与当前页面的关联度的参数根据实际需要确定。例如,当更偏重于收益时,可以只考虑目标关键词给网站带来的收益。即,计算目标关键词与当前页面的关联度的参数可以只选取收益值,根据收益值来确定分数。当更偏重于目标关键词与当前页面的相关性时,可以只考虑相关性,即计算目标关键词与当前页面的关联度的参数可以只选取相关度,根据相关度来确定关联度。可以理解,也可以同时利用前述两种参数共同来计算目标关键词与当前页面的关联度,还可以设定其他参数,具体参数以及计算规则本申请对此并不限制。
一般来说,在实际应用中,目标关键词投放的目的是给网站带来收益,并同时保证与当前页面的相关性,因此,本申请优选采用对网站收益的影响值以及与当前页面的相关性作为确定目标关键词与当前页面的关联度的两个参数。
具体的,可以采用如下步骤来计算目标关键词与当前页面的关联度:
子步骤1031,确定目标关键词对网站收益的影响值;
子步骤1032,确定目标关键词与当前页面的相关性分数;
子步骤1033,基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度。
其中,目标关键词的商业价值即为目标关键词对网站收益的影响值,可以采用如下方式计算:
D1,统计预定时间内当前目标关键词在投放之后为网站带来的收益总和;
D2,统计相同时间内当前目标关键词被投放的次数;
D3,根据所述收益总和和被投放的次数确定当前目标关键词的商业价值。
在具体实现时,可以通过将收益总和除以被投放的次数再乘以加权系数的方式来确定出当前目标关键词的商业价值的具体数值,假设商业价值为RPM,那么可以采用如下公式来计算:
profit表示一定时间段内,当前目标关键词在投放之后为网站带来的收益之和;expose表示相同时间段内,当前目标关键词被投放的次数。
目标关键词与当前页面的相关性分数通过如下方式计算:
S1,统计当前目标关键词在当前页面出现的次数以及在当前应用场景的所有页面中出现的次数;
S2,统计当前页面中所有目标关键词出现次数的总和;
S3,统计当前应用场景的所有页面的数目;
S4,基于前述步骤中所获取的参数计算目标关键词与当前页面的相关性分数。
在基于所获取的参数计算目标关键词与当前页面的相关性分数时,可以根据预定规则来进行,具体的预定规则可以根据实际需要来设定,只要计算结果能够客观表示目标关键词与当前页面的相关性即可。例如,假设目标关键词与当前页面的相关性Similar,可以采用如下方式计算:
Similar=tf*idf;
tf=n/N;
n表示当前目标关键词在当前页面出现的次数;N表示当前页面所有目标关键词出现次数的总和;df表示当前目标关键词在当前应用场景中所有页面中出现的次数;D表示当前应用场景中所有页面的数目。
以上数据可以在系统运行之前通过历史的数据获取。例如,某个售卖手机的画报场景,在系统运行之前就已经有很多网页了。获取这些页面上某个关键词出现的总次数作为N。D为当前这个场景下所有页面的数目,当实时获取页面的时候,判断这个页面上某个关键词出现的次数n。
基于所述影响值和相关性分数计算各目标关键词与当前页面的关联度包括:
确定影响值的权重值;
确定相关性分数的权重值;
基于所述目标关键词的影响值、相关性分数以及二者的权重值计算各目标关键词与当前页面的关联度。
假设目标关键词与当前页面的关联度为Score,前述两个参数的权重分别为α和β,那么目标关键词与当前页面的关联度为:
Score=α×RPM+β×Similar。
其中,α和β的具体取值本申请并不限制,可以根据两个参数的重要程度来确定。例如,若更偏重收益,则可以将α设定为一个较高的值,若更偏重相关性,则可以将β设定为一个较高的值。
步骤104,基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告。
服务器后台处理系统中预先存储了所有的关键词以及每一个关键词所对应的广告集合。具体的可以采用映射的方式,即每个关键词与其所对应的广告建立映射关系,当需要查找时,可以直接将关键词代入服务器中对应的位置查询,从而可以得到该关键词对应的广告集合。
具体的关键词以及与该关键词对应的广告集合可以根据具体需要来确定。例如,对于关键词MP3,其对应的广告集合可以是购买了MP3这个关键词的所有广告。还可以对MP3进行扩展,例如扩展为红色MP3,那么MP3对应的广告集合还可以包括购买红色MP3这个关键词的所有广告。
基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告包括:
按照各目标关键词与当前页面的关联度从大到小的顺序每次选取一个目标关键词;
从当前选取的目标关键词所对应的广告集合中选取需要展示的广告;
判断选取的广告数量是否达到预定数量,若否,则选取下一目标关键词,并重复上一步骤继续选取广告。
具体的,还可以采用如下方式进行选取:
T1,按照各目标关键词与当前页面的关联度的大小对目标关键词进行排序;
T2,按照目标关键词排序的先后顺序选取一个目标关键词,并获取该目标关键词所对应的广告集合;
T3,获取当前广告集合中的广告数量和当前页面广告展示位剩余数量,若广告数量小于剩余数量,则进行步骤T4,反之,则进行步骤T5;
T4,选取当前广告集合中所有的广告作为需要展示的广告,并选取下一目标关键词以及获取该目标关键词所对应的广告集合,返回步骤T3;
T5,对当前广告集合中的广告进行排序,按照排序的先后顺序选取数量等于剩余数量的广告作为需要展示的广告。
步骤T5中,对当前广告集合中的广告进行排序可以按照预定规则进行,可以设定影响排序的参数以及计算公式。例如,可以采用如下方法:
计算各广告与对应的目标关键词的相关性分数;获取各广告对应的广告主的出价;
根据所述相关性分数与出价计算各广告的排序分数,按照排序分数的大小对各广告进行排序。
具体的,可以直接将相关性分数与出价相乘得到排序分数,还可以采用将相关性分数与出价分别乘以各自对应的权重值后,再相加的方式来得到排序分数,本申请对此并不限制。
其中,计算各广告与对应的目标关键词的相关性分数可以根据实际情况来确定具体的计算方法,本申请采用如下公式进行计算:
V(d)表示广告向量化后的数值,V(q)表示与该广告对应的目标关键词向量化后的数值。
可以理解,本申请的广告选取过程中是根据目标关键词与当前页面的关联度来进行的,即先选取具有最大分数的目标关键词,获取其对应的广告集合,若该广告集合中的广告数量大于或者等于当前页面的广告展示位剩余数量,则直接从其中选取广告即可,无需再从其他目标关键词所对应的广告集合中选取广告。只有该广告集合中的广告数量小于当前页面的广告展示位剩余数量时,才会选取下一目标关键词,然后从其所对应的广告集合中选取广告,以此类推,直到选取的广告总量等于当前页面的广告展示位数量。也即,被选取广告可能是一个目标关键词所对应的广告,也可能是多个目标关键词所对应的广告的组合。为了体现在当前选取规则下,各被选取广告的准确度,当被选取广告是多个目标关键词所对应的广告的组合时,需要按照目标关键词与当前页面的关联度进行排序,即分数较大的目标关键词所对应的所有广告需要排在分数较小的目标关键词所对应的所有广告之前。单个目标关键词所对应的广告可以按照如步骤T5中相同的方式进行排序。
下面结合具体实例对前述过程进行详细说明。
假设,某个画报页面经过过滤后得到的目标关键词分别为a,b,c,对应的与当前页面的关联度,假设用具体分数表示,分别为10,8,5。其中,目标关键词a对应的广告集合为ga1,ga2,ga3;目标关键词b对应的广告集合为gb1,gb2,gb3;目标关键词c对应的广告集合为gc1,gc2,gc3。
在选取广告时,因为目标关键词a的分数最高,所以首先选取目标关键词a所对应的广告集合,其中的广告数量为3,假如该画报页面的广告展示位数量为3,当前广告展示位剩余数量也为3,那么可以知道,目标关键词a所对应的广告集合中的三个广告都需要被选取,此时,广告展示位剩余数量为0,无需再选取其他目标关键词所对应的广告。
假如该画报页面的广告展示位数量为5,当前广告展示剩余数量也为5,那么目标关键词a所对应的广告集合中的广告数量3小于剩余数量5,因此,目标关键词a所对应的广告集合中的三个广告需要全部被选取,即ga1,ga2,ga3。此时,该画报页面的广告展示位剩余数量为2,接下来,需要选取分数排在第二位的目标关键词b,其所对应的广告集合中的广告数量为3,则只能选取其中的两个广告。那么需要对目标关键词b所对应的广告集合中的广告进行排序,选取排在前面的两位,假设分别为gb 1和gb3。也即,最终选取的广告分别为ga1,ga2,ga3,gb1和gb3。
因为本申请对于广告的排序是基于目标关键词与当前页面的关联度进行,因此,在进行广告排序时,无论gb1和gb3的排序分数是否高于ga1,ga2或ga3,gb1和gb3都需要排在ga1,ga2和ga3的后面。ga1,ga2和ga3则可以按照前述的方法进行排序,gb1和gb3也可以按照前述的方法进行排序。
具体的,各广告的排序分数假设按照相关性分数与出价的乘积来计算,假设,目标关键词a与ga1,ga2,ga3的相关性分数分别为0.8,0.7,0.6,ga1,ga2,ga3的出价分别为6,10,9,那么ga1,ga2,ga3的排序分数分别为0.8×6=4.8,0.7×10=7,0.6×9=5.4,则三者最终的排序为ga2,ga3,ga1。
假设目标关键词b与gb1和gb3的相关性分数分别为0.9和0.7,gb1和gb2的出价分别为7和8,那么gb1和gb3的排序分数分别为0.9×7=6.3,0.7×8=5.6。可以看出,虽然gb1和gb3的排序分数大于ga3和ga1,但是因为目标关键词b的分数小于目标关键词a的分数,所以gb1和gb3需要排在ga3和ga1之后,因此,最终的排序结果为ga2,ga3,ga1,gb1,gb3。
可以理解,因为排序分数的计算是根据预定方法进行,前述实例只是其中的一个特例。为了避免出现排序混乱,优选地,在设定排序分数的计算方法时,优选的原则为:使目标关键词与当前页面的关联度较低的目标关键词所对应的广告的排序分数能够小于目标关键词与当前页面的关联度较高的目标关键词所对应的广告的排序分数。
参照图3,示出本申请的页面展示广告的选取方法实施例二,在实施例一的基础上,还包括:
步骤301,展示所有被选取广告,所述展示所有被选取广告包括随机展示或者对所有被选取广告排序后展示。
具体的排序过程与步骤105中所涉及的广告排序过程可以采用相同的方法。可以理解,为了便于展示,还可以直接在选取的过程中就进行排序,展示时则可以直接按照排序顺序进行展示。
参照图4,示出本申请的页面展示广告的选取系统实施例一,包括当前页面信息获取模块10、过滤模块20、关联度计算模块30和广告选取模块50。
当前页面信息获取模块10,用于获取当前页面的关键词。优选地,当前页面信息获取模块10包括页面内容抓取单元、文本内容提取单元和切分单元。页面内容抓取单元,用于抓取当前页面内容。文本内容提取单元,用于提取当前页面内容中的文本内容。切分单元,用于将所述文本内容传入服务器,按照预定规则进行切分,得到当前页面的关键词。
过滤模块20,用于对所述关键词进行过滤,得到目标关键词。过滤模块包括查询单元,用于查询产品词字典,若关键词不在所述产品词字典中,则过滤该关键词,反之,则保留该关键词。
关联度计算模块30,用于确定所述各目标关键词与当前页面的关联度。其中,关联度可以直接采用各目标关键词与当前页面的相关性分数表示,此时关联度计算模块可以包括相关性分数确定单元,用于确定目标关键词与当前页面的相关性分数。优选地,关联度还可以采用多种因素综合表示,此时,关联度计算模块可以包括影响值确定单元、相关性分数确定单元,用于确定目标关键词与当前页面的相关性分数和计算单元。影响值确定单元,用于确定目标关键词对网站收益的影响值。相关性分数确定单元,用于确定目标关键词与当前页面的相关性分数。计算单元,用于基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度。
广告选取模块50,用于基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告。
优选地,广告选取模块包括目标关键词排序单元、目标关键词选取单元、比较单元、广告选取单元和广告排序单元。目标关键词排序单元,用于按照各目标关键词与当前页面的关联度的大小对目标关键词进行排序。目标关键词选取单元,用于按照目标关键词排序的先后顺序选取一个目标关键词,并获取该目标关键词所对应的广告集合。比较单元,用于获取并比较当前广告集合中的广告数量和当前页面广告展示位剩余数量,若广告数量小于剩余数量,则触发广告选取单元,反之,则触发广告排序单元。广告选取单元,用于选取当前广告集合中所有的广告作为需要展示的广告,并选取下一目标关键词以及获取该目标关键词所对应的广告集合,触发比较单元。广告排序单元,用于对当前广告集合中的广告进行排序,按照排序的先后顺序选取数量等于剩余数量的广告作为需要展示的广告。
参照图5,示出本申请的页面展示广告的选取系统实施例二,该系统还包括展示模块60,用于展示所有被选取广告,所述展示所有被选取广告包括随机展示或者对所有被选取广告排序后展示。
本申请的页面展示广告的选取方法及系统中,通过对画报页面的关键词进行过滤得到目标关键词,并确定目标关键词与页面的关联度,最后基于目标关键词与页面的关联度来确定所需要选取的广告。在这个过程中,通过确定目标关键词与页面的关联度来确定目标关键词是否能够代表当前画报页面的主题,并以此作为选取广告的重要指标,从而可以保证所选取的广告能够与当前画报页面的主题具有较好的相关性,保证了广告选取的客观性。同时,因为画报页面的主题较为明确,无需将所有关键词与所有广告都进行相关性计算,只需要考虑能够表示主题的关键词与其对应的广告的相关性等参数的计算即可,减少了计算复杂度以及计算量,从而可以快速的选取出较为客观准确的广告。
另外,在进行广告选取时,按照目标关键词与当前页面的关联度的大小逐个选取,每次只需要计算当前选取的目标关键词所其对应的广告集合中的广告的排序分数,减少了不必要的计算过程,节省了计算时间,降低了计算复杂度。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请所提供的页面展示广告的选取方法及系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (20)

1.一种页面展示广告的选取方法,其特征在于,包括以下步骤:
获取当前页面的关键词;
对所述关键词进行过滤,得到目标关键词;
确定各目标关键词与当前页面的关联度;其中,所述确定目标关键词与当前页面的关联度对应的参数包括:对网站收益的影响值、和/或、与当前页面的相关性;
基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告。
2.如权利要求1所述的页面展示广告的选取方法,其特征在于,所述获取当前页面的关键词包括:
抓取当前页面内容;
提取当前页面内容中的文本内容;
将所述文本内容传入服务器,按照预定规则进行切分,得到当前页面的关键词。
3.如权利要求1所述的页面展示广告的选取方法,其特征在于,对所述关键词进行过滤包括:
查询产品词字典,若关键词不在所述产品词字典中,则过滤该关键词,反之,则保留该关键词。
4.如权利要求1所述的页面展示广告的选取方法,其特征在于,所述确定各目标关键词与当前页面的关联度包括:
确定目标关键词与当前页面的相关性分数,根据所述相关性分数确定各目标关键词与当前页面的关联度。
5.如权利要求4所述的页面展示广告的选取方法,其特征在于,所述确定目标关键词与当前页面的相关性分数包括:
统计当前目标关键词在当前页面出现的次数以及在当前应用场景的所有页面中出现的次数;
统计当前页面中所有目标关键词出现次数的总和;
统计当前应用场景的所有页面的数目;
基于前述步骤中所获取的参数计算目标关键词与当前页面的相关性分数。
6.如权利要求1所述的页面展示广告的选取方法,其特征在于,所述确定各目标关键词与当前页面的关联度包括:
确定目标关键词对网站收益的影响值;
确定目标关键词与当前页面的相关性分数;
基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度。
7.如权利要求6所述的页面展示广告的选取方法,其特征在于,所述确定目标关键词对网站收益的影响值包括:
统计预定时间内当前目标关键词在投放之后为网站带来的收益总和;
统计相同时间内当前目标关键词被投放的次数;
根据所述收益总和和被投放的次数确定当前目标关键词对网站收益的影响值。
8.如权利要求6所述的页面展示广告的选取方法,其特征在于,所述基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度包括:
确定影响值的权重值;
确定相关性分数的权重值;
基于所述目标关键词的影响值、相关性分数以及二者的权重值计算各目标关键词与当前页面的关联度。
9.如权利要求1所述的页面展示广告的选取方法,其特征在于,所述基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告包括:
按照各目标关键词与当前页面的关联度从大到小的顺序每次选取一个目标关键词;
从当前选取的目标关键词所对应的广告集合中选取需要展示的广告;
判断选取的广告数量是否达到预定数量,若否,则选取下一目标关键词,并重复上一步骤继续选取广告。
10.如权利要求1所述的页面展示广告的选取方法,其特征在于,所述基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告包括:
T1,按照各目标关键词与当前页面的关联度的大小对目标关键词进行排序;
T2,按照目标关键词排序的先后顺序选取一个目标关键词,并获取该目标关键词所对应的广告集合;
T3,获取并比较当前广告集合中的广告数量和当前页面广告展示位剩余数量,若广告数量小于剩余数量,则进行步骤T4,反之,则进行步骤T5;
T4,选取当前广告集合中所有的广告作为需要展示的广告,并选取下一目标关键词以及获取该目标关键词所对应的广告集合,返回步骤T3;
T5,对当前广告集合中的广告进行排序,按照排序的先后顺序选取数量等于剩余数量的广告作为需要展示的广告。
11.如权利要求10所述的页面展示广告的选取方法,其特征在于,所述对当前广告集合中的广告进行排序包括:
计算各广告与对应的目标关键词的相关性分数;
获取各广告对应的广告主的出价;
根据所述相关性分数与出价计算各广告的排序分数,按照排序分数的大小对各广告进行排序。
12.如权利要求1至11任一项所述的页面展示广告的选取方法,其特征在于,所述方法还包括:
展示所有被选取广告,所述展示所有被选取广告包括随机展示或者对所有被选取广告排序后展示。
13.一种页面展示广告的选取系统,其特征在于,包括:
当前页面信息获取模块,用于获取当前页面的关键词;
过滤模块,用于对所述关键词进行过滤,得到目标关键词;
关联度计算模块,用于确定所述各目标关键词与当前页面的关联度;其中,所述确定目标关键词与当前页面的关联度对应的参数包括:对网站收益的影响值、和/或、与当前页面的相关性;
广告选取模块,用于基于各目标关键词与当前页面的关联度确定最终选取的目标关键词,并从所述最终选取的目标关键词所对应的广告集合中选取需要展示的广告。
14.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述当前页面信息获取模块包括:
页面内容抓取单元,用于抓取当前页面内容;
文本内容提取单元,用于提取当前页面内容中的文本内容;
切分单元,用于将所述文本内容传入服务器,按照预定规则进行切分,得到当前页面的关键词。
15.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述过滤模块包括:
查询单元,用于查询产品词字典,若关键词不在所述产品词字典中,则过滤该关键词,反之,则保留该关键词。
16.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述关联度计算模块包括:
相关性分数确定单元,用于确定目标关键词与当前页面的相关性分数。
17.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述关联度计算模块包括:
影响值确定单元,用于确定目标关键词对网站收益的影响值;
相关性分数确定单元,用于确定目标关键词与当前页面的相关性分数;
计算单元,用于基于所述影响值和相关性分数计算当前目标关键词与当前页面的关联度。
18.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述广告选取模块包括:
目标关键词选取单元,用于按照各目标关键词与当前页面的关联度从大到小的顺序每次选取一个目标关键词;
广告选取单元,用于从当前选取的目标关键词所对应的广告集合中选取需要展示的广告;
判断单元,用于判断选取的广告数量是否达到预定数量,若否,则选取下一目标关键词,并触发广告选取单元继续选取广告。
19.如权利要求13所述的页面展示广告的选取系统,其特征在于,所述广告选取模块包括:
目标关键词排序单元,用于按照各目标关键词与当前页面的关联度的大小对目标关键词进行排序;
目标关键词选取单元,用于按照目标关键词排序的先后顺序选取一个目标关键词,并获取该目标关键词所对应的广告集合;
比较单元,用于获取并比较当前广告集合中的广告数量和当前页面广告展示位剩余数量,若广告数量小于剩余数量,则触发广告选取单元,反之,则触发广告排序单元;
广告选取单元,用于选取当前广告集合中所有的广告作为需要展示的广告,并选取下一目标关键词以及获取该目标关键词所对应的广告集合,触发比较单元;
广告排序单元,用于对当前广告集合中的广告进行排序,按照排序的先后顺序选取数量等于剩余数量的广告作为需要展示的广告。
20.如权利要求13至19任一项所述的页面展示广告的选取系统,其特征在于,所述系统还包括:
展示模块,用于展示所有被选取广告,所述展示所有被选取广告包括随机展示或者对所有被选取广告排序后展示。
CN201210157360.3A 2012-05-18 2012-05-18 页面展示广告的选取方法和系统 Active CN103425680B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210157360.3A CN103425680B (zh) 2012-05-18 2012-05-18 页面展示广告的选取方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210157360.3A CN103425680B (zh) 2012-05-18 2012-05-18 页面展示广告的选取方法和系统

Publications (2)

Publication Number Publication Date
CN103425680A CN103425680A (zh) 2013-12-04
CN103425680B true CN103425680B (zh) 2018-02-02

Family

ID=49650438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210157360.3A Active CN103425680B (zh) 2012-05-18 2012-05-18 页面展示广告的选取方法和系统

Country Status (1)

Country Link
CN (1) CN103425680B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104133830A (zh) * 2013-05-02 2014-11-05 乐视网信息技术(北京)股份有限公司 一种数据获取方法
CN105446970A (zh) * 2014-06-10 2016-03-30 华为技术有限公司 推荐项目的方法和装置
CN106776665A (zh) * 2015-11-25 2017-05-31 北京国双科技有限公司 关键词的投放方法和装置
CN110020123B (zh) * 2017-10-19 2023-05-12 腾讯科技(深圳)有限公司 一种推广信息投放方法、装置、介质及设备
CN109118275A (zh) * 2018-07-26 2019-01-01 王振 一种广告位精准分发方法及系统
CN111723260B (zh) * 2019-03-19 2023-08-04 百度在线网络技术(北京)有限公司 推荐内容的获取方法、装置、电子设备及可读存储介质
CN110543604A (zh) * 2019-09-09 2019-12-06 连尚(新昌)网络科技有限公司 信息处理方法和装置
CN111143738B (zh) * 2019-11-27 2023-06-09 北京三快在线科技有限公司 资源展示方法、装置、电子设备及存储介质
CN113239275B (zh) * 2021-05-28 2023-06-30 北京百度网讯科技有限公司 信息推送方法、装置、电子设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101196923A (zh) * 2006-11-28 2008-06-11 株式会社Opms 基于分类的广告系统和方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101329675A (zh) * 2007-06-19 2008-12-24 百度在线网络技术(北京)有限公司 网页广告匹配方法及系统
CN101458690A (zh) * 2007-12-14 2009-06-17 北京龙拓互动广告有限公司 一种发布广告的方法和广告服务器
CN101770482A (zh) * 2008-12-26 2010-07-07 北京搜狗科技发展有限公司 一种广告投放的方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101196923A (zh) * 2006-11-28 2008-06-11 株式会社Opms 基于分类的广告系统和方法

Also Published As

Publication number Publication date
CN103425680A (zh) 2013-12-04

Similar Documents

Publication Publication Date Title
CN103425680B (zh) 页面展示广告的选取方法和系统
CN104915734B (zh) 基于时间序列的商品热度预测方法和系统
JP5945332B2 (ja) パーソナライズ情報転送方法および装置
US8380784B2 (en) Correlated information recommendation
CN109829108B (zh) 信息推荐方法、装置、电子设备及可读存储介质
CN110060090A (zh) 推荐商品组合的方法、装置、电子设备及可读存储介质
EP2717211A1 (en) Advertising system, advertising system control method, program, and information storage medium
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
CN106445963B (zh) App平台的广告索引关键词自动生成方法和装置
TW201539346A (zh) 提供使用者評價資訊的方法及系統
KR20180039154A (ko) 검색을 시드하는 시스템 및 방법
CN109213936B (zh) 商品搜索方法和装置
CN109064293A (zh) 商品推荐方法、装置、计算机设备及存储介质
CN104462554B (zh) 问答页面相关问题推荐方法和装置
CN112000747A (zh) 数据多维分析方法、装置及系统
TWI550535B (zh) 基於他人購物清單之商品組合推薦系統、網站、及其方法
CN112149003B (zh) 商品社群推荐方法、装置和计算机设备
CN107704941B (zh) 一种显示物品评论的方法及装置
CN110647679A (zh) 一种o2o场景下的搜索结果综合排序方法
CN108428138A (zh) 一种基于客户分群的客户生存率分析装置及分析方法
CN110782232A (zh) 业务流程可视化配置方法、装置、电子设备及存储介质
JP5455978B2 (ja) パターン抽出装置及び方法
CN107993078A (zh) 用于评价信息展示效果方法和装置以及计算设备
CN112214663A (zh) 获取舆情声量的方法、系统、装置、存储介质及移动终端
EP3062240A1 (en) Search system, search criteria setting device, control method for search criteria setting device, program, and information storage medium

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant