CN103577481B - 一种广告数据搜索的方法和装置 - Google Patents

一种广告数据搜索的方法和装置 Download PDF

Info

Publication number
CN103577481B
CN103577481B CN201210278131.7A CN201210278131A CN103577481B CN 103577481 B CN103577481 B CN 103577481B CN 201210278131 A CN201210278131 A CN 201210278131A CN 103577481 B CN103577481 B CN 103577481B
Authority
CN
China
Prior art keywords
key word
data
sub
user
temperature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210278131.7A
Other languages
English (en)
Other versions
CN103577481A (zh
Inventor
殷维栋
孟晓楠
仇光
郭宁
李小剑
姜罕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210278131.7A priority Critical patent/CN103577481B/zh
Publication of CN103577481A publication Critical patent/CN103577481A/zh
Application granted granted Critical
Publication of CN103577481B publication Critical patent/CN103577481B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种广告数据搜索的方法和装置,其中所述方法包括:判断用户类型是否为新人模式;若是,则在预置的关键词数据库中选取目标关键词;按照所述目标关键词提取对应的广告数据;向用户返回所述广告数据。本申请可以简化用户操作,减少服务器负担,降低客户端与服务器资源耗费的基础上,提高无搜索关键词搜索广告数据的准确性与全面性。

Description

一种广告数据搜索的方法和装置
技术领域
本申请涉及网络信息处理的技术领域,特别是涉及一种广告数据搜索的方法,以及,一种广告数据搜索的装置。
背景技术
在电子商务迅速发展的今天,外投广告已经成为一种广泛应用的网络广告投放模式。外投广告是指通过BD(Business Development,商务拓展)合作,借助合作方的网站,投放己方广告。这种方式不但能增加合作方的网站用户成为广告的受众,而且大大降低搭建投放平台的成本。在BD合作中,在合作方站点投放广告时,新人模式是一种常见的形态,由于合作方网站的用户行为及偏好难以获得,并且互联网访问者的多样性和随机性,因此如何针对新人模式投放准确的广告成为本技术领域的技术难题之一。
现有技术中,针对新人模式进行外投广告数据的搜索最常用的方法是采用固定关键词搜索出广告数据向用户展现的方式。用户若在其中发现其感兴趣的广告数据,直接点击即可进入相关的产品页面。然而,现有技术中的固定关键词可能是人工选定的,或根据某个搜索网站的搜索频次统计得来的,这种方式显然无法保证搜索出广告数据针对新人模式的用户的准确性和全面性,无法搜索出一些相对于新人模式的用户而言其所需要的广告,在这种情况下,用户只能通过其它渠道,比如搜索引擎获得其想要的广告信息,相对于直接点击广告数据进入相关产品页面的操作而言,不仅用户操作更加繁琐,并且将大大增加服务器的负担,耗费更多客户端与服务器的资源。
因此,本领域技术人员迫切需要解决的问题是:提供一种不需要根据搜索关键词进行广告数据搜索的机制,用以在简化用户操作,减少服务器负担,降低客户端与服务器资源耗费的基础上,提高无搜索关键词搜索广告数据的准确性与全面性。
发明内容
本申请所要解决的技术问题是提供一种广告数据搜索的方法,用以在简化用户操作,减少服务器负担,降低客户端与服务器资源耗费的基础上,提高无搜索关键词搜索广告数据的准确性与全面性。
相应的,本申请还提供了一种广告数据搜索的装置,用以保证上述方法在实际中的应用。
为了解决上述问题,本申请公开了一种广告数据搜索的方法,包括:
判断用户类型是否为新人模式;
若是,则在预置的关键词数据库中选取目标关键词;
按照所述目标关键词提取对应的广告数据;
向用户返回所述广告数据;
其中,所述预置的关键词数据库中包括热度指标数据大于预设阈值的多个关键词;所述在预置的关键词数据库中选取目标关键词的步骤包括如下子步骤:
子步骤S11,根据所述预置的关键词数据库中待处理关键词的热度指标数据,生成热度指标分布区间;
子步骤S12,在所述热度指标分布区间中进行关键词采样;
子步骤S13,判断所述采样的关键词的数量是否达到预设数量;若是,则执行子步骤S14;若否,则执行子步骤S15;
子步骤S14,将所述满足预设数量的采样关键词作为目标关键词;
子步骤S15,确定待处理关键词后,返回子步骤S11。
优选地,所述方法还包括:
依据所述目标关键词的热度指标数据,分别生成对应的各广告数据的展现时间和/或展现频率;
所述向用户返回广告数据的步骤为,按照所述展现时间和/或展现频率向用户展现所述广告数据。
优选地,所述子步骤S11进一步包括:
统计预置的关键词数据库中待处理关键词的热度指标数据的汇总值;
计算各个待处理关键词的热度指标数据占所述汇总值的比例;
根据所述各个待处理关键词的热度指标数据占汇总值的比例,生成各个待处理关键词的累积分布概率;
根据所述各个待处理关键词的累积分布概率,划分热度指标分布区间,所述热度指标分布区间由两个连续累积分布概率形成。
优选地,所述子步骤S12进一步包括:
生成随机数;
查找所述随机数所属的热度指标分布区间;
从所述热度指标分布区间中,提取与所述随机数最接近的累积分布概率所对应的关键词作为采样的关键词;
所述子步骤S15确定待处理关键词的步骤进一步包括:
将所述预置的关键词数据库中去除所述采样的关键词后剩余的关键词,确定为待处理关键词。
优选地,所述判断用户类型是否为新人模式的步骤包括:
获取当前登录用户的Cookies信息;
若没有所述用户的Cookies信息,则确定当前用户的类型为新人模式。
优选地,所述关键词的热度指标数据包括关键词在网络上的搜索量、点击量和/或浏览量。
本申请还公开了一种广告数据搜索的装置,包括:
新人模式判断模块,用于判断用户类型是否为新人模式;若是,则调用目标关键词选取模块;
目标关键词选取模块,用于在预置的关键词数据库中选取目标关键词;所述预置的关键词数据库中包括热度指标数据大于预设阈值的多个关键词;
广告数据提取模块,用于按照所述目标关键词提取对应的广告数据;
返回模块,用于向用户返回所述广告数据;
其中,所述目标关键词选取模块包括如下子模块:
热度指标分布区间生成子模块,用于根据所述预置的关键词数据库中待处理关键词的热度指标数据,生成热度指标分布区间;
关键词采样子模块,用于在所述热度指标分布区间中进行关键词采样;
采样数量判断子模块,用于判断所述采样的关键词的数量是否达到预设数量;若是,则调用目标关键词确定子模块;若否,则调用待处理关键词确定子模块;
目标关键词确定子模块,用于将所述满足预设数量的采样关键词作为目标关键词;
待处理关键词确定子模块,用于在确定待处理关键词后,返回调用所述热度指标分布区间生成子模块。
优选地,所述装置还包括:
展现设置模块,用于依据所述目标关键词的热度指标数据,分别生成对应的各广告数据的展现时间和/或展现频率;
所述返回模块包括:
特定展现子模块,用于按照所述展现时间和/或展现频率向用户展现所述广告数据。
优选地,所述热度指标分布区间生成子模块进一步包括:
热度指标汇总值统计单元,用于统计预置的关键词数据库中待处理关键词的热度指标数据的汇总值;
比重计算单元,用于计算各个待处理关键词的热度指标数据占所述汇总值的比例;
累积分布计算单元,用于根据所述各个待处理关键词的热度指标数据占汇总值的比例,生成各个待处理关键词的累积分布概率;
区间划分单元,用于根据所述各个待处理关键词的累积分布概率,划分热度指标分布区间,所述热度指标分布区间由两个连续累积分布概率形成。
优选地,所述关键词采样子模块进一步包括:
随机数产生单元,用于生成随机数;
区间查找单元,用于查找所述随机数所属的热度指标分布区间;
关键词提取单元,用于从所述热度指标分布区间中,提取与所述随机数最接近的累积分布概率所对应的关键词作为采样的关键词;
所述待处理关键词确定子模块进一步包括:
调整单元,用于将所述预置的关键词数据库中去除所述采样的关键词后剩余的关键词,确定为待处理关键词。
优选地,所述新人模式判断模块包括:
记录获取子模块,用于获取当前登录用户的Cookies信息;
判定子模块,用于在没有所述用户的Cookies信息时,确定当前用户的类型为新人模式。
与现有技术相比,本申请具有以下优点:
本申请在判定用户类型为新人模式的情况下,通过获取网络上流行的具有代表性的关键词,根据这些关键词的热度指标数据生成热度指标分布区间,然后在所述热度指标分布区间中进行关键词采样,再采用采样的关键词搜索对应的广告并返回给用户,从而可以保证所采样关键词的代表性,全面性和准确性。由于所采样关键词的代表性,全面性和准确性,可以使新人模式的用户在无需提交搜索关键词的情况下,直接获得其所想要的感兴趣内容,即直接点击其感兴趣的广告数据即可进入相关的产品或服务页面,而无需重复登录网站提交搜索关键词搜索其想要的内容,不仅可以简化用户操作,还能减少服务器负担,有效降低客户端与服务器资源耗费,并能提高新人模式用户获得其感兴趣内容的速度。
本申请还可以解决现有技术中采用定时轮循的方式展现搜索出来的广告数据,无法突出重点,不能反映关键词本身的一些热度差异性的问题,可以随关键词热度动态调整对应广告数据的展现时长,以更灵活地匹配用户需求。举例来说,对于互联网上A1,A2,A3,...,An这n个关键词分别对应的广告数据G1,G2,G3,...,Gn,若关键词A1的热度指标数据高于其它关键词,则应用本申请实施例可以使G1的展现时间比其它广告数据的时间更长,或者,展现频率更多,能使用户更轻易捕捉到其感兴趣的广告数据。
附图说明
图1是本申请一种广告数据搜索的方法实施例1的步骤流程图;
图2是本申请一种广告数据搜索的方法实施例中一种选取目标关键词的流程图;
图3是本申请一种广告数据搜索的方法实施例中另一种选取目标关键词的流程图;
图4是本申请一种广告数据搜索的方法实施例2的结构框图;
图5是本申请一种广告数据搜索装置实施例的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请实施例的核心构思之一在于,在判定用户类型为新人模式的情况下,通过获取网络上流行的具有代表性的关键词,根据这些关键词的热度指标数据生成热度指标分布区间,然后在所述热度指标分布区间中进行关键词采样,再采用采样的关键词搜索对应的广告并返回给用户。
参照图1,示出了一种广告数据搜索的方法实施例1的步骤流程图,具体可以包括以下步骤:
步骤101、判断用户类型是否为新人模式;若是,则执行步骤102;
在外投广告的技术领域,新人模式是一种常见的形态,具有如下特点:1)合作方网站的用户行为及偏好难以获得,2)互联网访问者具有多样性和随机性。在实际中,新人模式的用户是指第一次浏览网站的用户,因为没有太多的浏览行为记录,所以对网站而言,无法对访问者行为定向。
在本申请的一种优选实施例中,所述步骤101可以通过如下子步骤判断用户类型是否为新人模式:
子步骤S21,获取当前登录用户的Cookies信息;
子步骤S22,若没有所述用户的Cookies信息,则确定当前用户的类型为新人模式;
子步骤S23,若存在所述用户的Cookies信息,则确定当前用户的类型为非新人模式。
例如,外投广告对象网站X服务器发送探测消息给访问用户A,探测消息查找不到用户A的Cookies信息,则判定用户A当前的浏览模式为新人模式。
当然,上述判断新人模式的方式仅仅用作示例,本领域技术人员采用其他方式进行判断均是可行的,例如,查询数据库中是否有该用户的IP地址,判断该用户是否为新注册用户等,本申请对此无需加以限制。
需要说明的是,本申请实施例涉及的是在无用户提交搜索关键词情况下的广告数据搜索方案,即广告数据搜索并非依据用户提交的搜索关键词进行的,而是根据用户访问的信息,判定用户类型为新人模式的情况下,自动选取目标关键词进行广告数据搜索的一种方案。
对于非新人模式下的用户,可以在获取了用户的Cookies信息后,从所述用户的Cookies信息中分析对应用户的偏好和可能关注项,根据用户的偏好和可能关注项,选取关键词生成搜索广告数据用的关键词。由于非新人模式下的广告数据搜索处理与本申请的核心构思关联不大,故在此不作详细阐述。
步骤102,在预置的关键词数据库中选取目标关键词;
其中,所述预置的关键词数据库中包括热度指标数据大于预设阈值的多个关键词。
在具体实现中,为了提升新人模式用户的体验,确保预置的关键词数据库中关键词的代表性,可以从访问量较大的多个网站中提取搜索关键词,这种大流量网站的突出优点是用户多,并且这些用户在互联网中占有重要的比重,其搜索行为可以近似代替互联网用户的搜索行为。对于从这些大流量网站中提取的搜索关键词,进一步统计其热度指标数据,若大于预设的某个阈值,则将该搜索关键词提取出来放入关键词数据库中。
例如,从某几个大型电子商务网站提取用户使用的搜索关键词,在冬天具有高于预设阈值的热度指标数据的关键词可能是“雪地靴”,“棉衣”等,而在夏天具有高于预设阈值的热度指标数据的关键词可能是“短袖T恤”,“空调被”等。在实际中,所述热度指示数据的预设阈值可以由本领域技术人员根据实际情况任意设置,本申请对此不作限制。
作为本申请实施例具体应用的一种示例,所述关键词的热度指标数据可以包括关键词在网络上的搜索量、点击量和/或浏览量等。
参考图2,在本申请的一种优选实施例中,所述步骤102可以通过如下子步骤在预置的关键词数据库中选取目标关键词:
子步骤S11,根据所述预置的关键词数据库中待处理关键词的热度指标数据,生成热度指标分布区间;
子步骤S12,在所述热度指标分布区间中进行关键词采样;
子步骤S13,判断所述采样的关键词的数量是否达到预设数量;若是,则执行子步骤S14;若否,则执行子步骤S15;
子步骤S14,将所述满足预设数量的采样关键词作为目标关键词;
子步骤S15,确定待处理的关键词后,返回子步骤S11。
其中,所述待处理的关键词即在采样的关键词的数量未达到预设数量时,作为下一次采样基础的关键词。因为在关键词的采样过程中,需要使得之前已经采样出的关键词不再重复出现。也就是说,在具体实现中,在第一次采样时,所述预置的关键词数据库中的所有关键词即为“待处理的关键词”,在后续采样中,在预置的关键词数据库中去除在先采样出的关键词后所剩余的关键词即为“待处理的关键词”。
参考图3,在本申请的另一种优选实施例中,所述步骤102可以通过如下子步骤在预置的关键词数据库中选取目标关键词:
子步骤S31,统计预置的关键词数据库中待处理关键词的热度指标数据的汇总值;
子步骤S32,计算各个待处理关键词的热度指标数据占所述汇总值的比例;
例如,待处理关键词包括a1,a2和a3,分别对应的PV(Page view,点击量,一种热度指标数据的示例)为40,30,30,则关键词a1占汇总值(40+30+30=100)的比例为0.4,关键词a2占汇总值的比例为0.3,关键词a3占汇总值的比例为0.3。
子步骤S33,根据所述各个待处理关键词的热度指标数据占汇总值的比例,生成各个待处理关键词的累积分布概率;
其中,所述累积分布概率由累积分布函数计算得到,累积分布函数能完整描述一个实随机变量X的概率分布,是概率密度函数的积分。一般以大写“CDF”(CumulativeDistribution Function)表记。对于所有实数x,累积分布函数定义如下:
F(x)=P(X≤x)
子步骤S34,根据所述各个待处理关键词的累积分布概率,划分热度指标分布区间,所述热度指标分布区间由两个连续累积分布概率形成。
例如,对于如以下表1所示的关键词和累积分布概率:
关键词 累积分布概率
雪地靴 0.448
1212全民疯抢 0.665
羽绒服 0.846
短靴 1
对累积分布概率涉及的全范围[0,1]区间进行了如下的划分:
0→c0=0.448→c1=0.665→c2=0.846→c3=1;
即形成如下几个热度指标分布区间:
[0,0.448];
[0.448,0.665];
[0.665,0.846];
[0.846,1]。
子步骤S35,生成随机数;
参照上例,可以在累积分布概率涉及的全范围[0,1]区间中,随机采样出一个随机数u。在实际中,产生随机数有多种不同的方法。这些方法被称为随机数发生器,本申请对此不作限制。随机数最重要的特性是:它所产生的后面的那个数与前面的那个数毫无关系。在本例中,假设u=0.759。
子步骤S36,查找所述随机数所属的热度指标分布区间;
参照上例,u属于区间I2=[0.665,0.846]。
子步骤S37,从所述热度指标分布区间中,提取与所述随机数最接近的累积分布概率所对应的关键词作为采样的关键词;
参照上例,通过区间位置索引,可以得到本次抽取的关键词是“羽绒服”。
子步骤S38,判断所述采样的关键词的数量是否达到预设数量;若是,则执行子步骤S39;若否,则执行子步骤S40;
子步骤S39,将所述满足预设数量的采样关键词作为目标关键词;
子步骤S40,将所述预置的关键词数据库中去除所述采样的关键词后剩余的关键词,确定为待处理关键词后,返回子步骤S31;
当需要在一次广告数据搜索中提供若干个不同的关键词时,需要对累积分布进行适当的调整。调整的原则是既要使得之前已经抽样出的关键词不再重复出现,也要保持未采样的关键词的相对分布情况。参照上例,当需要两个关键词时,第一次抽样出“羽绒服”之后,第二次不能再抽取该关键词了,应该抽取“雪地靴”,“1212全面疯抢”,“短靴”之中的一个,并且仍然要按照这三个关键词的概率分布来采样。
在具体实现中,则可以在预置的关键词数据库中去除所述采样的关键词,然后返回子步骤S31基于剩余的关键词重新计算热度指标数据汇总值开始继续执行后续子步骤完成下一个关键词的采样。
当然,上述选取目标关键词的方式仅仅用作示例,本领域技术人员根据实际情况采用其他目标关键词的选取方法也是可行的,本申请对此无需加以限制。
步骤103,按照所述目标关键词提取对应的广告数据;
步骤104,向用户返回所述广告数据。
在具体实现中,可以拿采样出的若干关键词去广告引擎提取广告并展现出来,这样互联网用户就能在外投的站点上看到新人模式下的广告了。
参照图4,示出了一种广告数据搜索的方法实施例2的流程图,具体可以包括以下步骤:
步骤201、判断用户类型是否为新人模式;若是,则执行步骤202;
步骤202、在预置的关键词数据库中选取目标关键词;
步骤203、按照所述目标关键词提取对应的广告数据;
步骤204、依据所述目标关键词的热度指标数据,分别生成对应的各广告数据的展现时间和/或展现频率;
步骤205、按照所述展现时间和/或展现频率向用户展现所述广告数据。
本实施例与图1所示实施例的不同之处在于,本实施例可以根据关键词热度指标数据的高低,设置对应的各广告数据的展现时间和/或展现频率,例如,将热度指标数据高的关键词所对应的广告数据设置得展现时间更长或展现频率更多,将热度指标数据低的关键词所对应的广告数据设置得展现时间更短或展现频率更少。
在现有技术中通常会采用定时轮循的方式展现搜索出来的广告数据,即针对每个关键词所搜索出的广告数据采用固定时间进行播放,无法突出重点,不能反映关键词本身的一些热度差异性。举例来说,对于互联网上A1,A2,A3,...,An这n个固定关键词分别对应的广告数据G1,G2,G3,...,Gn,分别各展现10秒,但实际中用户可能对A1对应的广告数据G1更感兴趣,若展现G1的时间比其它广告数据的时间更长,也将使用户更轻易捕捉到其感兴趣的广告数据。
本实施例则可以有效解决此问题,可以随关键词热度动态调整对应广告数据的展现时长,以更灵活地匹配用户需求。举例而言,对于互联网上A1,A2,A3,...,An这n个关键词对应的广告数据G1,G2,G3,...,Gn,若关键词A1的热度指标数据高于其它关键词,则应用本申请实施例可以使G1的展现时间比其它广告数据的时间更长,或者,展现频率更多,能使用户更轻易捕捉到其感兴趣的广告数据。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请所必须的。
参照图5,示出了一种广告数据搜索的装置实施例的结构框图,具体可以包括如下模块:
新人模式判断模块501,用于判断用户类型是否为新人模式;若是,则调用目标关键词选取模块502;
目标关键词选取模块502,用于在预置的关键词数据库中选取目标关键词;所述预置的关键词数据库中包括热度指标数据大于预设阈值的多个关键词;
广告数据提取模块503,用于按照所述目标关键词提取对应的广告数据;
返回模块504,用于向用户返回所述广告数据;
其中,所述目标关键词选取模块502可以包括如下子模块:
热度指标分布区间生成子模块5021,用于根据所述预置的关键词数据库中待处理关键词的热度指标数据,生成热度指标分布区间;
关键词采样子模块5022,用于在所述热度指标分布区间中进行关键词采样;
采样数量判断子模块5023,用于判断所述采样的关键词的数量是否达到预设数量;若是,则调用目标关键词确定子模块5024;若否,则调用待处理关键词确定子模块5025;
目标关键词确定子模块5024,用于将所述满足预设数量的采样关键词作为目标关键词;
待处理关键词确定子模块5025,用于在确定待处理关键词后,返回调用所述热度指标分布区间生成子模块5021。
作为本申请实施例具体应用的一种示例,所述关键词的热度指标数据可以包括关键词在网络上的搜索量、点击量和/或浏览量等。
在具体实现中,本申请实施例还可以包括如下模块:
展现设置模块,用于依据所述目标关键词的热度指标数据,分别生成对应的各广告数据的展现时间和/或展现频率;
在这种情况下,所述返回模块504可以包括如下子模块:
特定展现子模块,用于按照所述展现时间和/或展现频率向用户展现所述广告数据。
在本申请的一种优选实施例中,所述热度指标分布区间生成子模块5021进一步包括如下单元:
热度指标汇总值统计单元,用于统计预置的关键词数据库中待处理关键词的热度指标数据的汇总值;
比重计算单元,用于计算各个待处理关键词的热度指标数据占所述汇总值的比例;
累积分布计算单元,用于根据所述各个待处理关键词的热度指标数据占汇总值的比例,生成各个待处理关键词的累积分布概率;
区间划分单元,用于根据所述各个待处理关键词的累积分布概率,划分热度指标分布区间,所述热度指标分布区间由两个连续累积分布概率形成。
在这种情况下,所述关键词采样子模块5022可以进一步包括如下单元:
随机数产生单元,用于生成随机数;
区间查找单元,用于查找所述随机数所属的热度指标分布区间;
关键词提取单元,用于从所述热度指标分布区间中,提取与所述随机数最接近的累积分布概率所对应的关键词作为采样的关键词;
所述待处理关键词确定子模块5025可以进一步包括如下单元:
调整单元,用于将所述预置的关键词数据库中去除所述采样的关键词后剩余的关键词,确定为待处理关键词。
作为本申请实施例具体应用的一种示例,所述新人模式判断模块501可以包括如下子模块:
记录获取子模块,用于获取当前登录用户的Cookies信息;
判定子模块,用于在没有所述用户的Cookies信息时,确定当前用户的类型为新人模式。
由于所述装置实施例基本相应于前述方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此就不赘述了。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
最后,还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种广告数据搜索的方法,以及,一种广告数据搜索的装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (11)

1.一种广告数据搜索的方法,其特征在于,包括:
判断用户类型是否为新人模式;
若是,则在预置的关键词数据库中选取目标关键词;
按照所述目标关键词提取对应的广告数据;
向用户返回所述广告数据;
其中,所述预置的关键词数据库中包括热度指标数据大于预设阈值的多个关键词;所述在预置的关键词数据库中选取目标关键词的步骤包括如下子步骤:
子步骤S11,根据所述预置的关键词数据库中待处理关键词的热度指标数据,生成热度指标分布区间;
子步骤S12,在所述热度指标分布区间中进行关键词采样;
子步骤S13,判断所述采样的关键词的数量是否达到预设数量;若是,则执行子步骤S14;若否,则执行子步骤S15;
子步骤S14,将所述满足预设数量的采样关键词作为目标关键词;
子步骤S15,确定待处理关键词后,返回子步骤S11;
所述子步骤S15确定待处理关键词的步骤进一步包括:
将所述预置的关键词数据库中去除所述采样的关键词后剩余的关键词,确定为待处理关键词。
2.如权利要求1所述的方法,其特征在于,还包括:
依据所述目标关键词的热度指标数据,分别生成对应的各广告数据的展现时间和/或展现频率;
所述向用户返回广告数据的步骤为,按照所述展现时间和/或展现频率向用户展现所述广告数据。
3.如权利要求1或2所述的方法,其特征在于,所述子步骤S11进一步包括:
统计预置的关键词数据库中待处理关键词的热度指标数据的汇总值;
计算各个待处理关键词的热度指标数据占所述汇总值的比例;
根据所述各个待处理关键词的热度指标数据占汇总值的比例,生成各个待处理关键词的累积分布概率;
根据所述各个待处理关键词的累积分布概率,划分热度指标分布区间,所述热度指标分布区间由两个连续累积分布概率形成。
4.如权利要求3所述的方法,其特征在于,所述子步骤S12进一步包括:
生成随机数;
查找所述随机数所属的热度指标分布区间;
从所述热度指标分布区间中,提取与所述随机数最接近的累积分布概率所对应的关键词作为采样的关键词。
5.如权利要求4所述的方法,其特征在于,所述判断用户类型是否为新人模式的步骤包括:
获取当前登录用户的Cookies信息;
若没有所述用户的Cookies信息,则确定当前用户的类型为新人模式。
6.如权利要求1或2或4或5所述的方法,其特征在于,所述关键词的热度指标数据包括关键词在网络上的搜索量、点击量和/或浏览量。
7.一种广告数据搜索的装置,其特征在于,包括:
新人模式判断模块,用于判断用户类型是否为新人模式;若是,则调用目标关键词选取模块;
目标关键词选取模块,用于在预置的关键词数据库中选取目标关键词;所述预置的关键词数据库中包括热度指标数据大于预设阈值的多个关键词;
广告数据提取模块,用于按照所述目标关键词提取对应的广告数据;
返回模块,用于向用户返回所述广告数据;
其中,所述目标关键词选取模块包括如下子模块:
热度指标分布区间生成子模块,用于根据所述预置的关键词数据库中待处理关键词的热度指标数据,生成热度指标分布区间;
关键词采样子模块,用于在所述热度指标分布区间中进行关键词采样;
采样数量判断子模块,用于判断所述采样的关键词的数量是否达到预设数量;若是,则调用目标关键词确定子模块;若否,则调用待处理关键词确定子模块;
目标关键词确定子模块,用于将所述满足预设数量的采样关键词作为目标关键词;
待处理关键词确定子模块,用于在确定待处理关键词后,返回调用所述热度指标分布区间生成子模块;
所述待处理关键词确定子模块进一步包括:
调整单元,用于将所述预置的关键词数据库中去除所述采样的关键词后剩余的关键词,确定为待处理关键词。
8.如权利要求7所述的装置,其特征在于,还包括:
展现设置模块,用于依据所述目标关键词的热度指标数据,分别生成对应的各广告数据的展现时间和/或展现频率;
所述返回模块包括:
特定展现子模块,用于按照所述展现时间和/或展现频率向用户展现所述广告数据。
9.如权利要求7或8所述的装置,其特征在于,所述热度指标分布区间生成子模块进一步包括:
热度指标汇总值统计单元,用于统计预置的关键词数据库中待处理关键词的热度指标数据的汇总值;
比重计算单元,用于计算各个待处理关键词的热度指标数据占所述汇总值的比例;
累积分布计算单元,用于根据所述各个待处理关键词的热度指标数据占汇总值的比例,生成各个待处理关键词的累积分布概率;
区间划分单元,用于根据所述各个待处理关键词的累积分布概率,划分热度指标分布区间,所述热度指标分布区间由两个连续累积分布概率形成。
10.如权利要求9所述的装置,其特征在于,所述关键词采样子模块进一步包括:
随机数产生单元,用于生成随机数;
区间查找单元,用于查找所述随机数所属的热度指标分布区间;
关键词提取单元,用于从所述热度指标分布区间中,提取与所述随机数最接近的累积分布概率所对应的关键词作为采样的关键词。
11.如权利要求10所述的装置,其特征在于,所述新人模式判断模块包括:
记录获取子模块,用于获取当前登录用户的Cookies信息;
判定子模块,用于在没有所述用户的Cookies信息时,确定当前用户的类型为新人模式。
CN201210278131.7A 2012-08-06 2012-08-06 一种广告数据搜索的方法和装置 Active CN103577481B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210278131.7A CN103577481B (zh) 2012-08-06 2012-08-06 一种广告数据搜索的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210278131.7A CN103577481B (zh) 2012-08-06 2012-08-06 一种广告数据搜索的方法和装置

Publications (2)

Publication Number Publication Date
CN103577481A CN103577481A (zh) 2014-02-12
CN103577481B true CN103577481B (zh) 2017-03-01

Family

ID=50049279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210278131.7A Active CN103577481B (zh) 2012-08-06 2012-08-06 一种广告数据搜索的方法和装置

Country Status (1)

Country Link
CN (1) CN103577481B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462412A (zh) * 2014-12-11 2015-03-25 北京国双科技有限公司 用于网络关键词投放的关键词检测方法和装置
CN104980776A (zh) * 2015-07-06 2015-10-14 无锡天脉聚源传媒科技有限公司 一种新广告的推送方法及装置
WO2018027362A1 (zh) * 2016-08-06 2018-02-15 胡明祥 根据朋友圈信息推送广告的方法以及推送系统
CN113703688B (zh) * 2021-09-20 2024-03-15 安徽丰合佳行信息技术有限公司 一种基于大数据和文件热度的分布式存储节点负载调整方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1465021A (zh) * 2001-06-06 2003-12-31 索尼公司 广告选择装置、广告选择方法及存储介质
CN101038648A (zh) * 2006-03-17 2007-09-19 腾讯科技(深圳)有限公司 基于搜索引擎的广告信息投放方法及广告信息发布服务器
CN101114295A (zh) * 2007-08-11 2008-01-30 腾讯科技(深圳)有限公司 检索在线广告资源的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1465021A (zh) * 2001-06-06 2003-12-31 索尼公司 广告选择装置、广告选择方法及存储介质
CN101038648A (zh) * 2006-03-17 2007-09-19 腾讯科技(深圳)有限公司 基于搜索引擎的广告信息投放方法及广告信息发布服务器
CN101114295A (zh) * 2007-08-11 2008-01-30 腾讯科技(深圳)有限公司 检索在线广告资源的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
建立在搜索引擎用户数据库之上的精准广告投放;陈晓红;《新闻传播》;20120615;第214页 *

Also Published As

Publication number Publication date
CN103577481A (zh) 2014-02-12

Similar Documents

Publication Publication Date Title
CN101882162B (zh) 一种网络信息推送方法及系统
CN102591942B (zh) 一种应用自动推荐的方法及装置
US8209277B2 (en) Predicting the outcome of events based on related internet activity
CN103634687B (zh) 智能电视中提供视频搜索结果的方法及系统
CN107609198A (zh) 一种推荐方法、装置及计算机可读存储介质
US20120233173A1 (en) Determining preferred categories based on user access attribute values
CN102968413B (zh) 一种用于提供搜索结果的方法与设备
CN107800801A (zh) 一种基于用户学习偏好的学习资源推送方法及系统
CN106919641A (zh) 一种兴趣点搜索方法及装置、电子设备
CN107609152A (zh) 用于扩展查询式的方法和装置
CN106339398A (zh) 一种网页页面的预读取方法、装置及智能终端设备
CN103744916B (zh) 一种用于确定目标视频的分享热度信息的方法与设备
CN104899315A (zh) 推送用户信息的方法和装置
CN104021140B (zh) 一种网络视频的处理方法及装置
CN102521249B (zh) 一种基于同质资源的展现方法及设备
CN108230113A (zh) 用户画像生成方法、装置、设备及可读存储介质
CN103577481B (zh) 一种广告数据搜索的方法和装置
CN104503988B (zh) 搜索方法及装置
CN104156356B (zh) 个性化导航页面生成方法及装置
CN106611366A (zh) 自动选品的方法及装置
KR20110057264A (ko) 미디어 공유 채널을 평가하는 방법, 시스템 및 장치
CN106528777A (zh) 跨屏用户标识归一的方法及其系统
CN103699534B (zh) 系统目录中数据对象的显示方法及装置
CN103713894A (zh) 一种用于确定用户的访问需求信息的方法与设备
CN102968510A (zh) 互联网人物信息的搜索方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant