CN105159930B - 搜索关键词的推送方法和装置 - Google Patents

搜索关键词的推送方法和装置 Download PDF

Info

Publication number
CN105159930B
CN105159930B CN201510475975.4A CN201510475975A CN105159930B CN 105159930 B CN105159930 B CN 105159930B CN 201510475975 A CN201510475975 A CN 201510475975A CN 105159930 B CN105159930 B CN 105159930B
Authority
CN
China
Prior art keywords
search
user
keyword
described search
clicking rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510475975.4A
Other languages
English (en)
Other versions
CN105159930A (zh
Inventor
陈进生
范欣
王亮
魏春水
胡晨
李冰结
王剑
冯立强
郁蓓
鲁玉兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510475975.4A priority Critical patent/CN105159930B/zh
Publication of CN105159930A publication Critical patent/CN105159930A/zh
Application granted granted Critical
Publication of CN105159930B publication Critical patent/CN105159930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明实施例公开了一种搜索关键词的推送方法和装置。所述方法包括:从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词;对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序;根据所述排序的次序向用户的移动终端推送所述搜索关键词。本发明实施例提供的搜索关键词的推送方法和装置为不同的用户定制不同的搜索关键词,实现了个性化的搜索关键词推送。

Description

搜索关键词的推送方法和装置
技术领域
本发明实施例涉及搜索引擎技术领域,尤其涉及一种搜索关键词的推送方法和装置。
背景技术
伴随着互联网的发展,越来越多的用户开始使用搜索引擎。随着搜索引擎的使用率的提升,搜索引擎开始推出一些辅助手段来提高搜索效率。在这些辅助手段中,搜索关键词的自动推荐是其中非常重要的一种。所谓搜索关键词的自动推荐,即当用户点击搜索框,或者输入某个关键词时,搜索结果页面能够出现一系列可能与用户输入的关键词相关的关键词。用户如果点击这些相关的关键词,则用户可以进行进一步的搜索。
现有的搜索关键词的挖掘方式是一种被动的方式。具体来说,一般会选取一些搜索引擎开发人员根据经验得出的热搜词,然后将这些热搜词推送给用户。这种推送方式的缺陷在于,很少考虑用户的个性化需求,对不同用户推送的搜索关键词往往并没有什么区别。
发明内容
针对上述技术问题,本发明实施例提供了一种搜索关键词的推送方法和装置,从而为不同的用户定制不同的搜索关键词,实现个性化的搜索关键词推送。
第一方面,本发明实施例提供了一种搜索关键词的推送方法,所述方法包括:
从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词;
对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序;
根据所述排序的次序向用户的移动终端推送所述搜索关键词。
第二方面,本发明实施例还提供了一种搜索关键词的推送装置,所述装置包括:
获取模块,用于从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词;
排序模块,用于对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序;
推送模块,用于根据所述排序的次序向用户的移动终端推送所述搜索关键词。
本发明实施例提供的搜索关键词的推送方法和装置通过从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词,对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序,以及根据所述排序的次序向用户的移动终端推送所述搜索关键词,为不同的用户定制不同的搜索关键词,实现了个性化的搜索关键词推送。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明第一实施例提供的搜索关键词的推送方法的流程图;
图2是本发明第二实施例提供的搜索关键词的推送方法中的推送步骤的流程图;
图3是本发明第二实施例提供的搜索关键词的显示界面背景;
图4A是本发明第二实施例提供的搜索关键词的显示效果图;
图4B是本发明第二实施例提供的搜索关键词的热搜图片的显示效果图;
图4C是本发明第二实施例提供的搜索关键词的热搜语音的显示效果图;
图5是本发明第三实施例提供的搜索关键词的推送方法的流程图;
图6是本发明第四实施例提供的搜索关键词的推送方法中获取步骤的流程图;
图7是本发明第五实施例提供的搜索关键词的推送方法的流程图;
图8是本发明第五实施例的一种优选实施方式中获取步骤的流程图;
图9是本发明第五实施例的另一种优选实施方式中获取步骤的流程图;
图10是本发明第五实施例的另一种优选实施方式中随机游走算法的原理示意图;
图11是本发明第六实施例提供的搜索关键词的推送方法中获取步骤的流程图;
图12是本发明第七实施例提供的搜索关键词的推送方法中获取步骤的流程图;
图13是本发明第八实施例提供的搜索关键词的推送方法中排序步骤的流程图;
图14是本发明第九实施例提供的搜索关键词的推送方法中排序步骤的流程图;
图15是本发明第十实施例提供的搜索关键词的推送装置的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
第一实施例
本实施例提供了搜索关键词的推送方法的一种技术方案。所述搜索关键词的推送方法由搜索关键词的推送装置执行,并且,所述搜索关键词的推送装置通常集成在网络侧的搜索引擎服务器等计算设备中。
参见图1,所述搜索关键词的推送方法包括:
S11,从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词。
在本实施例中,用于获取搜索关键词的数据源可以有多个。比如,可以将用户历史日志、互联网网页、实时搜索日志中的任意一个或者它们的组合作为获取所述搜索关键词的数据源。所述用户历史日志,是指用于记录用户使用搜索引擎的历史操作的日志文件。具体的,所述用户历史日志中记录有用户在一段时间之前使用搜索引擎时输入的搜索词,在搜索结果页面上点击查看的网页链接等信息。
所述互联网网页是指在互联网上的,公众能够访问的网络页面。进一步的,所述互联网网页中应当包含用户能够从其中获取到搜索关键词的内容数据。这种内容数据一般情况下是以文字的形式呈现给公众的。
所述实时搜索日志是指对用户使用搜索引擎的动作进行实时记录的日志文件。所述实时搜索日志最大的特点在于它本身的时效性。也就是说,所述实时搜索日志能够反映用户使用搜索引擎的实时动作。
用户的阅读上下文是指用户通过互联网阅读的内容的上下文。比如,用户的阅读内容如果是一个互联网网页,则所述阅读上下文可以是用户在阅读这个网页之前或者之后所点击的网页地址。
所述场景包括页面场景和用户场景。页面场景可以包括网站类型、页面属性、页面内容等参数。用户场景可以包括用户的访问设备、来源地点等参数。
基于用户的阅读上下文和场景参数来获取将要推送给用户的搜索关键词,获取到的搜索关键词将会因为用户本身的阅读习惯及场景参数而发生变化。这样,对于不同的用户,搜索引擎获取到的搜索关键词将会不同。即使是同一个用户,在不同的时期,搜索引擎获取到的搜索关键词也将不同。也就是说,获取到的搜索关键词会充分考虑用户本身的阅读习惯和场景,从而为实现个性化的搜索关键词推送提供了前提。
S12,对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序。
可以理解的是,如果一个搜索关键词的点击率高,则说明该搜索关键词更为有效,用户更愿意使用该搜索关键词来搜索互联网。因此,在推送搜索关键词之时,应该尽量选择点击率排名靠前的搜索关键词,进行推送。
为了向用户推送更为有效的搜索关键词,对所述搜索关键词进行点击率估计,并依据估计得到的点击率对所述搜索关键词进行排序。具体的,可以依据式(1)给出的点击率估计模型估计不同搜索关键词的点击率。
在式(1)中,CTRtemplate表示广告位阶段的点击率,CTRlu表示链接单元阶段的点击率。xi表示在广告位阶段所述搜索关键词、对应的页面场景、用户场景的特征向量元素,wi表示所述特征向量元素对应的权重向量元素。xj表示在连接单元阶段所述搜索关键词、对应的页面场景、用户场景的特征向量元素,wj表示在链接单元阶段所述特征向量元素对应的权重向量元素。其中,所述特征向量元素可以是与所述搜素关键词在相同数据源中共现概率较高的词语。所述权重向量元素则是所述特征向量元素在点击率估计模型中的加权值参数。
可以看出,在基于式(1)模型的点击率估计过程中,分为广告位阶段的点击率估计和链接单元阶段的点击率估计。在广告位阶段中,估计的点击率参数是整个广告位的点击率;而在链接单元阶段,估计的点击率参数是一个具体的搜索关键词在该广告位上的点击率。
S13,根据所述排序的次序向用户的移动终端推送所述搜索关键词。
优选的,可以根据移动终端的屏幕宽度取值范围,涉及展现所述搜索关键词的界面布局,再根据所述界面布局,向移动终端展现所述搜索关键词。
进一步优选的,可以在所述界面上为每个搜索关键词设计其对应的展现区域,并为它的展现区域配以对应的背景色,从而达到视觉效果的美观。
而且,在推送所述搜索关键词时,可以通过对展现时间参数的调整,调整推荐的搜索关键词的展现次序,从而保证推送给用户的搜索关键词的时效性。
本实施例通过从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词,对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序,以及根据所述排序的次序向用户的移动终端推送所述搜索关键词,从而为不同的用户定制不同的搜索关键词,实现个性化的搜索关键词推送。
第二实施例
本实施例以本发明的上述实施例为基础,进一步的提供了搜索关键词的推送方法中推送步骤的一种技术方案。在该技术方案中,根据所述排序的次序向用户的移动终端推送所述搜索关键词包括:根据移动终端的屏幕宽度,设计各搜索关键词的界面布局;根据所述界面布局,向用户展现所述搜索关键词、所述搜索关键词对应的热搜图片和/或所述搜索关键词对应的热搜语音。
参见图2,根据所述排序的次序向用户的移动终端推送所述搜索关键词包括:
S21,根据移动终端的屏幕宽度,设计各搜索关键词的界面布局。
由于移动终端的屏幕宽度一般不大,因此在设计用于展现所述搜索关键词的展示界面的界面布局时,要求各个搜索关键词的布局较为紧凑。
图3示例性的示出了所述搜索关键词的展示界面的一种界面布局。参见图3,在所述展示界面上,不同搜索关键词的展示区域用不同的颜色的色块标出。对于点击率高,或者本身文字具有一定长度的搜索关键词,使用面积较大的色块;而对于点击率低,或者本身文字长度较小的搜索关键词,使用面积较小的色块。
图3示出的界面布局是移动终端横向放置时采用的界面布局。当然,还可以为移动终端纵向放置另行设计界面布局。
另外,可以根据展现是季节的不同,使用不同颜色色调的色块完成界面布局。例如,在冬季时可以采用冷色调的色块进行界面布局,而在夏季时可以采用暖色调的色块进行界面布局。
S22,根据所述界面布局,向用户展现所述搜索关键词、所述搜索关键词对应的热搜图片和/或所述搜索关键词对应的热搜语音。
依据移动终端的屏幕宽度完成所述界面布局设计之后,可以在所述界面布局的对应区域显示所述搜索关键词。图4A、图4B及图4C分别显示了在所述显示界面的对应位置展现所述搜索关键词、所述搜索关键词对应的热搜图片及所述搜索关键词对应的热搜语音的显示效果图。
本实施例通过根据移动终端的屏幕宽度,设计各搜索关键词的界面布局,以及根据所述界面布局,向用户展现所述搜索关键词、所述搜索关键词对应的热搜图片和/或所述搜索关键词对应的热搜语音,从而不仅实现了搜索关键词推送的内容个性化,而且实现了搜索关键词推送界面的个性化。
第三实施例
本实施例以本发明上述实施例为基础,进一步的提供了搜索关键词的推送方法的一种技术方案。在该技术方案中,从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词包括:从用户历史日志、互联网网页和/或实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词。
参见图5,所述搜索关键词的推送方法包括:
S51,从用户历史日志、互联网网页和/或实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词。
从用户历史日志中挖掘所述搜索关键词,可以根据历史数据获得相关的搜索关键词。比如,根据所述用户历史日志,用户在使用搜索词“下一站”搜索互联网之后,经常立即使用搜索词“城铁”再次搜索互联网。此时,通过对用户历史日志的挖掘,当用户在搜索框中输入“下一站”时,搜索引擎会推荐“城铁”这个搜索关键词。
优选的,从用户历史日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词包括:根据用户关注主体、兴趣点和/或意图数据,建立关于用户标签和场景的关联矩阵;根据用户标签和场景查询所述关联矩阵,获取所述搜索关键词。
从互联网网页中挖掘所述搜索关键词,能够根据用户的阅读习惯挖掘到目标搜索关键词。比如,如果用户搜索“天坛”这个搜索词之后浏览的网页中,大部分都包含“东城区”这个关键词,那么当用户在搜索框中输入“天坛”这个搜索词之后,搜索引擎会推荐“东城区”这个搜索关键词。
优选的,从互联网网页中,挖掘与用户的阅读上下文和场景相关的搜索关键词包括:根据所述互联网网页中的文本,或者用户对互联网网页的点击关系,从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词。
所谓互联网网页中的文本,特指用户使用搜索引擎过程中所阅读的网页中的文本。优选的,可以通过对互联网网页中文本的分词,重要度计算等操作,实现对搜索关键词的挖掘。
所谓互联网网页的点击关系,是指在同一次搜索会话中用户所执行的在两次或者两次以上的网页链接的点击动作之间的关系。优选的,可以通过对不同搜索词之间的跳转概率的统计,或者URL(Uniform resource locator,统一资源定位符)与搜索词之间的跳转概率的统计,实现对搜索关键词的挖掘。
从实时搜索日志中挖掘所述搜索关键词,能够将其他用户使用的热搜词实时同步给使用搜索引擎的用户。比如,用户在使用搜索引擎时,其他大多数用户都使用“抗战胜利”这个热搜词搜索互联网,则通过对实时搜索日志的挖掘,会将“抗战胜利”这个热搜词作为搜索关键词,并将所述搜索关键词推送给使用搜索引擎的用户。
S52,对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序。
S53,根据所述排序的次序向用户的移动终端推送所述搜索关键词。
本实施例通过从用户历史日志、互联网网页和/或实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词,实现了从至少一个数据源中对所述搜索关键词的获取,从而实现了推荐的搜索关键词的个性化。
第四实施例
本实施例以本发明的上述实施例为基础,进一步的提供了搜索关键词的推送方法中获取步骤的一种技术方案。在该技术方案中,从用户历史日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词包括:根据用户关注主体、兴趣点和/或意图数据,建立关于用户标签和场景的关联矩阵;根据用户标签和场景查询所述关联矩阵,获取所述搜索关键词。
参见图6,从用户历史日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词包括:
S61,根据用户关注主体、兴趣点和/或意图数据,建立关于用户标签和场景的关联矩阵。
所述用户关注主体是指用户在浏览搜索引擎提供的搜索结果页面时,关注的主体词汇。所述兴趣点是指代表用户在浏览网页时的兴趣的词语。所述意图数据是指用户使用搜索引擎进行互联网搜索的意图。可以理解的是,上述三种数据均可以通过对用户的浏览数据及搜索引擎使用日志的挖掘而获得。而且,通过对上述三种数据的挖掘,可以直接或者间接的得到所述搜索关键词。
在本实施例中,对用户群体按照自身的属性分配用户标签。例如,可以按照用户的性别或者年龄段分配不同的用户标签。然后,以所述用户标签作为关联矩阵的横轴坐标,并以所述场景作为关联矩阵的纵轴标签,根据从用户关注主体、兴趣点和/或意图数据中挖掘得到数据,建立所述关联矩阵。
S62,根据用户标签和场景查询所述关联矩阵,获取所述搜索关键词。
建立所述关联矩阵之后,根据所述用户标签和场景匹配所述关联矩阵的横轴标签和纵轴标签,从而获取所述关联矩阵中存储的词,并将获取到的词作为所述搜索关键词。
本实施例通过根据用户关注主体、兴趣点和/或意图数据,建立关于用户标签和场景的关联矩阵,以及根据用户标签和场景查询所述关联矩阵,获取所述搜索关键词,从而实现从用户历史日志中的搜索关键词挖掘。
第五实施例
本实施例以本发明上述实施例为基础,进一步的提供了搜索关键词的推送方法的一种技术方案。在该技术方案中,从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词包括:从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词。
参见图7,所述搜索关键词的推送方法包括:
S71,从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词。
具体的,从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词包括:根据所述互联网网页中的文本,或者用户对互联网网页的点击关系,从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词。
示例性的,图8示出了在本实施例的一种优选实施方式下,根据所述互联网网页中的文本从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词的流程图。参见图8,根据所述互联网网页中的文本从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词包括:
S81,从用户历史日志中获取用户输入搜索词后所浏览的网页。
S82,根据TF-IDF算法,从所述网页的文本中提取具有代表性的关键词。
S83,将所述具有代表性的关键词作为所述搜索关键词。
所述TF-IDF算法是一种统计算法,用来评估一个字词对于一个文件的重要程度。优选的,可以先对用户输入搜索词后所浏览的网页中的文本进行切词,然后对切词结果分别利用所述TF-IDF算法计算其重要度,在从不同的切词结果中选择重要度排序优先的,从而实现对具有代表性的关键词的提取。完成对具有代表性的关键词的提取之后,将提取到的具有代表性的关键词作为所述搜索关键词。
根据用户对互联网网页的点击关系,从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词包括:根据用户在一次会话中搜索词之间的跳转关系,挖掘所述搜索关键词;或者根据用户在一次会话中URL与搜索词之间的跳转关系,挖掘所述搜索关键词。
可以理解的是,在一次搜索会话中,用户可能使用不同的搜索词搜索互联网。而在一次搜索会话中前后使用的搜索关键词有很大的可能在语义或者逻辑上存在关联。因此,可以通过挖掘用户在一次搜索会话中不同搜索词之间的跳转关系,实现对所述搜索关键词的挖掘。
另外,在一次搜索会话中,用户可能访问不同的网页,这些网页的URL中可能包含有与用户搜索时使用的搜索词存在关联的词。因此,可以通过挖掘用户在一次搜索会话中URL与搜索词之间的跳转关系,挖掘所述搜索关键词。
需要说明的是,一个URL与一个搜索词之间存在跳转关系可以是用户在使用所述搜索词搜索互联网之后,点击了所述URL,还可以是用户在点击了所述URL,也即浏览了所述URL对应的网页之后,使用所述搜索词再搜索互联网。
示例性的,图9示出了在本实施例的另一种优选实施方式下,根据URL与搜索词之间的跳转关系,挖掘所述搜索关键词的流程。参见图9,根据用户在一次会话中URL与搜索词之间的跳转关系,挖掘所述搜索关键词包括:
S91,统计URL与搜索词之间的一次跳转概率。
如前文所述,用户在点击URL之后使用搜索词搜索互联网,或者使用搜索词搜索互联网之后点击URL,都可以计为URL与搜索词之间的一次跳转。
S92,利用随机游走算法,根据所述一次跳转概率计算URL与搜索词之间的跳转概率。
图10示出了所述随机游走算法的原理。参见图10,在计算URL101与搜索词102之间的跳转概率时,假设另一个中间搜索词103与所述URL101及所述搜索词102之间都存在跳转关系,则所述中间搜索词103分别与所述搜索词102及所述URL101之间的条件转移概率相乘,并针对不同的中间搜索词103,将上述相乘结果求和,就得到了所述URL101与所述搜索词102之间的跳转概率。也就是说,所述URL101与所述搜索词102之间的跳转概率可以由式(2)给出:
S93,将跳转概率最高的搜索词作为所述搜索关键词。
优选的,可以设定跳转概率阈值,并将跳转概率高于所述跳转概率阈值的搜索词作为所述搜索关键词。另外,还可以取跳转概率最高的N个搜索词,并将这N个搜索词作为所述搜索关键词。
S72,对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序。
S73,根据所述排序的次序向用户的移动终端推送所述搜索关键词。
本实施例通过从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词,实现了基于用户的阅读兴趣的搜索关键词挖掘,进而实现了搜索关键词推荐的个性化。
第六实施例
本实施例以本发明上述实施例为基础,进一步的提供了搜索关键词的推送方法中获取步骤的一种技术方案。在该技术方案中,从实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词包括:通过实时挖掘搜索日志,统计搜索词对应检索量、用户数,和检索量变化率;根据实时统计的检索量、用户数,和检索量变化率,拟合搜索指数函数;根据所述搜索指数函数,选择在整个用户群体上热门的搜索词,作为所述搜索关键词。
参见图11,从实时搜索日志中挖掘与用户的阅读上下文和场景相关的搜索关键词包括:
S111,通过实时挖掘搜索日志,统计搜索词对应检索量、用户数,和检索量变化率。
可以理解的是,在所述实时搜索日志中,每个搜索词有它对应的检索量、用户数。在本实施例中,通过挖掘所述实时搜索日志,对每个搜索词的检索量、用户数进行统计,并通过运算计算所述搜索词的检索量变化率。
S112,根据实时统计的检索量、用户数,和检索量变化率,拟合搜索指数函数。
具体的,通过对所述检索量、用户数以及检索量变化率的计算,得到所述搜索词对应的搜索指数函数。进一步的,所述搜索指数函数由式(3)给出:
其中,h(t)是搜索指数函数,s(t)是统计得到的检索量,n(t)是统计得到的用户数,rate(t)是检索量变化率。
S113,根据所述搜索指数函数,选择搜索词,作为所述搜索关键词。
根据预先设定的搜索指数阈值,从众多的搜索词中选取所述搜索关键词。优选的,可以选择所述搜索指数函数的取值在预先设定的搜索指数最小阈值之上的搜索词,作为所述搜索关键词。
本实施例通过实时挖掘搜索日志,统计搜索词对应检索量、用户数,和检索量变化率,根据实时统计的检索量、用户数,和检索量变化率,拟合搜索指数函数,以及根据所述搜索指数函数,选择搜索词,作为所述搜索关键词,从而实现了根据实时搜索日志的搜索关键词挖掘。
第七实施例
本实施例以本发明上述实施例为基础,进一步的提供了搜素关键词的推送方法中获取步骤的一种技术方案。在该技术方案中,在根据所述搜索指数函数,选择搜索词,作为所述搜索关键词之前,从实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词还包括:对所述搜索词进行过滤;在根据所述搜索指数函数,选择搜索词,作为所述搜索关键词之后,从实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词还包括:对所述搜索关键词,添加热搜图片和/或热搜语音;对所述热搜图片和/或热搜语音进行压缩,并存储压缩后的热搜图片和/或热搜语音。
参见图12,从实时搜索日志中挖掘与用户的阅读上下文和场景相关的搜索关键词包括:
S121,通过实时挖掘搜索日志,统计搜索词对应检索量、用户数,和检索量变化率。
S122,根据实时统计的检索量、用户数,和检索量变化率,拟合搜索指数函数。
S123,对所述搜索词进行过滤。
为了保证挖掘出的搜索关键词的内容健康,在选择所述搜索关键词之前,对备选的搜索词统一进行内容过滤。具体的,可以根据预先设置的停用词表,对所述搜索词中内容不健康的进行滤除。
S124,根据所述搜索指数函数,选择搜索词,作为所述搜索关键词。
S125,对所述搜索关键词,添加热搜图片和/或热搜语音。
为了所述搜索关键词的展现界面的美观和多样化,为所述搜索关键词添加内容与之匹配的热搜图片。另外,还可以为所述搜索关键词添加内容与之匹配的热搜语音。
S126,对所述热搜图片和/或热搜语音进行压缩,并存储压缩后的热搜图片和/或热搜语音。
本实施例通过在根据所述搜索指数函数选择搜索词,并作为所述搜索关键词之前,对所述搜索词进行过滤,以及在根据所述搜索指数函数选择搜索词,并作为所述搜索关键词之后,对所述搜索关键词,添加热搜图片和/或热搜语音,以及对所述热搜图片和/或热搜语音进行压缩,并存储压缩后的热搜图片和/或热搜语音,不仅保证了推送的搜索关键的内容健康,而且为所述搜索关键词配备了热搜图片和/或热搜语音,使得对所述搜索关键词的展现界面更为多样。
第八实施例
本实施例以本发明上述实施例为基础,进一步的提供了搜索关键词的推送方法中排序步骤的一种技术方案。在该技术方案中,对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序包括:根据点击率估计模型估计所述搜索关键词的点击率;根据所述点击率对所述搜索关键词进行排序。
参见图13,对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序包括:
S131,根据点击率估计模型估计所述搜索关键词的点击率。
所述点击率估计模型由式(1)给出。其中,所述搜索关键词的特征向量通过对所述搜索关键词的上下文的统计分析而得到。通常情况下,所述搜索关键词的特征向量是与所述搜索关键词的共现概率较高的一组词语。
S132,根据所述点击率对所述搜索关键词进行排序。
完成了对所述搜索关键词的点击率估计之后,根据估计得到的点击率,对所述搜索关键词进行排序。
本实施例通过根据点击率模型估计所述搜索关键词的点击率,以及根据所述点击率对所述搜索关键词进行排序,从而对所述搜索关键词的有效性进行了区分,使得对所述搜索关键词的推送更有目的性。
第九实施例
本实施例以本发明上述实施例为基础,进一步的提供了搜索关键词的推送方法中排序步骤的一种技术方案。在该技术方案中,在根据点击率估计模型估计所述搜索关键词的点击率之前,对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序还包括:根据用户历史行为,获取所述搜索关键词的特征向量;根据所述特征向量及目标点击率,训练所述点击率估计模型。
参见图14,对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序包括:
S141,根据用户历史行为,获取所述搜索关键词的特征向量。
在本实施例中,根据用户的历史行为对所述搜索关键词的特征向量进行挖掘。优选的,可以挖掘在一次搜索会话中与所述搜索关键词共现概率较高的词语,作为所述搜索关键词的特征向量中的元素。还可以将所述搜索关键词的页面场景、用户场景作为所述搜索关键词的特征向量中的元素。
需要说明的是,为了保证获取到的所述搜索关键词的特征向量数据的准确程度,在根据共现概率获取到所述搜索关键词的特征向量元素以后,还需要对获取到的特征向量元素进行一次过滤。这样做的目的在于滤除所述特征向量元素中的不可靠的样本数据。具体做法可以是查看特征向量元素在所有用户的历史行为中与所述搜索关键词之间的共现概率。如果在所有用户的历史数据中,所述特征向量元素与所述搜索关键词的共现概率偏低,则可以将这个特征向量元素从特征向量中删除。
S142,根据所述特征向量及目标点击率,训练所述点击率估计模型。
所述点击率估计模型由前文中的式(1)给出。在模型的训练阶段,每个训练样本,也就是搜索词都具有其对应的目标点击率。根据所述训练样本及其目标点击率,训练所述点击率估计模型,直至所述点击率估计模型中的所有权重向量均收敛。
另外,在完成了所述点击率估计模型的训练之后,还需要根据ROC(Receiveroperating characteristic curve,受试者工作特征曲线)曲线的AUC(Area under curve,曲线下面积)参数,以及MAE(Mean absolute error,平均绝对误差)对训练好的点击率估计模型的预测能力和预测误差进行评估。AUC能够反映所述点击率估计模型对用户点击行为和不点击行为的预测能力。MAE能够反映所述点击率估计模型预测误差的大小。采用上述两种参数对训练的点击率估计模型进行评估,能够保证所述模型在对点击率进行估计的有效性和准确率。
S143,根据点击率估计模型估计所述搜索关键词的点击率。
S144,根据所述点击率对所述搜索关键词进行排序。
本实施例通过在根据点击率估计模型估计所述搜索关键词的点击率之前,根据用户历史行为获取所述搜索关键词的特征向量,以及根据所述特征向量及目标点击率,训练所述点击率估计模型,使得所述点击率估计模型能够准确的给出所述搜索关键词的点击率的估计值。
第十实施例
本实施例提供了搜索关键词的推送装置的一种技术方案。参见图15,在该技术方案中,所述搜索关键词的推送装置包括:获取模块151、排序模块152以及推送模块153。
所述获取模块151用于从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词。
所述排序模块152用于对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序。
所述推送模块153用于根据所述排序的次序向用户的移动终端推送所述搜索关键词。
可选的,所述推送模块151包括:布局设计单元以及展现单元。
所述布局设计单元用于根据移动终端的屏幕宽度,设计各搜索关键词的界面布局。
所述展现单元用于根据所述界面布局,向用户展现所述搜索关键词、所述搜索关键词对应的热搜图片和/或所述搜索关键词对应的热搜语音。
可选的,所述获取模块151具体用于:从用户历史日志、互联网网页和/或实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词。
可选的,当从用户历史中日志挖掘与用户的阅读上下文和场景相关的搜索关键词之时,所述获取模块151包括:矩阵建立单元以及关键词获取单元。
所述矩阵建立单元用于根据用户关注主体、兴趣点、意图等数据,建立关于用户标签和场景的关联矩阵。
所述关键词获取单元用于根据用户标签和场景查询所述关联矩阵,获取所述搜索关键词。
可选的,当从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,所述获取模块151具体用于:根据所述互联网网页中的文本,或者用户对互联网网页的点击关系,从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词。
可选的,当根据所述互联网网页中的文本从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,所述获取模块151包括:网页获取单元、关键词提取单元以及关键词确定单元。
所述网页获取单元用于从用户历史日志中获取用户输入搜索词后所浏览的网页。
所述关键词提取单元用于根据TF-IDF算法,从所述网页的文本中提取具有代表性的关键词。
所述关键词确定单元用于将所述具有代表性的关键词作为所述搜索关键词。
可选的,当根据用户对不同互联网网页的点击关系从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,所述获取模块151包括:搜索词跳转关系挖掘单元,或者URL跳转关系挖掘单元。
所述搜索词跳转关系挖掘单元用于根据用户在一次会话中不同搜索词之间的跳转关系,挖掘所述搜索关键词。
所述URL跳转关系挖掘单元用于根据用户在一次会话中统一资源定位符URL与搜索词之间的跳转关系,挖掘所述搜索关键词。
可选的,所述URL跳转关系挖掘单元具体用于:统计URL与搜索词之间的一次跳转概率;利用随机游走算法,根据所述一次跳转概率计算URL与搜索词之间的跳转概率;将跳转概率最高的搜索词作为所述搜索关键词。
可选的,当从实时搜索日志中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,所述获取模块151包括:统计单元、拟合单元以及关键词选择单元。
所述统计单元用于通过实时挖掘搜索日志,统计搜索词对应检索量、用户数,和检索量变化率。
所述拟合单元用于根据实时统计的检索量、用户数,和检索量变化率,拟合搜索指数函数。
所述关键词选择单元用于根据所述搜索指数函数,选择搜索词,作为所述搜索关键词。
可选的,当从实时搜索日志中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,在根据所述搜索指数函数,选择搜索词,作为所述搜索关键词之前,所述获取模块151还包括:过滤单元。
所述过滤单元用于对所述搜索词进行过滤。
可选的,当从实时搜索日志中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,在根据所述搜索指数函数选择搜索词,作为所述搜索关键词之后,所述获取模块151还包括:多媒体添加单元以及多媒体存储单元。
所述多媒体添加单元用于对所述搜索关键词,添加热搜图片和/或热搜语音。
所述多媒体存储单元用于对所述热搜图片和/或热搜语音进行压缩,并存储压缩后的热搜图片和/或热搜语音。
可选的,所述排序模块152包括:估计单元以及排序单元。
所述估计单元用于根据点击率估计模型估计所述搜索关键词的点击率,其中,所述点击率估计模型由下式给出:
所述排序单元用于根据所述点击率对所述搜索关键词进行排序。
可选的,所述排序模块152还包括:向量获取单元以及模型训练单元。
所述向量获取单元用于在根据点击率估计模型估计所述搜索关键词的点击率之前,根据用户历史行为,获取所述搜索关键词的特征向量。
所述模型训练单元用于在根据点击率估计模型估计所述搜索关键词的点击率之前,根据所述特征向量及目标点击率,训练所述点击率估计模型。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间的相同或相似的部分互相参见即可。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (24)

1.一种搜索关键词的推送方法,其特征在于,包括:
从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词;
对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序;
根据所述排序的次序向用户的移动终端推送所述搜索关键词;
其中,从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词包括:从用户历史日志、互联网网页和/或实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词。
2.根据权利要求1所述的方法,其特征在于,根据所述排序的次序向用户的移动终端推送所述搜索关键词包括:
根据移动终端的屏幕宽度,设计各搜索关键词的界面布局;
根据所述界面布局,向用户展现所述搜索关键词、所述搜索关键词对应的热搜图片和/或所述搜索关键词对应的热搜语音。
3.根据权利要求1所述的方法,其特征在于,从用户历史日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词包括:
根据用户关注主体、兴趣点和/或意图数据,建立关于用户标签和场景的关联矩阵;
根据用户标签和场景查询所述关联矩阵,获取所述搜索关键词。
4.根据权利要求1所述的方法,其特征在于,从互联网网页中,挖掘与用户的阅读上下文和场景相关的搜索关键词包括:
根据所述互联网网页中的文本,或者用户对互联网网页的点击关系,从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词。
5.根据权利要求4所述的方法,其特征在于,根据所述互联网网页中的文本,从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词包括:
从用户历史日志中获取用户输入搜索词后所浏览的网页;
根据TF-IDF算法,从所述网页的文本中提取具有代表性的关键词;
将所述具有代表性的关键词作为所述搜索关键词。
6.根据权利要求4所述的方法,其特征在于,根据用户对互联网网页的点击关系,从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词包括:
根据用户在一次会话中搜索词之间的跳转关系,挖掘所述搜索关键词;或者
根据用户在一次会话中统一资源定位符URL与搜索词之间的跳转关系,挖掘所述搜索关键词。
7.根据权利要求6所述的方法,其特征在于,根据用户在一次会话中URL与搜索词之间的跳转关系,挖掘所述搜索关键词包括:
统计URL与搜索词之间的一次跳转概率;
利用随机游走算法,根据所述一次跳转概率计算URL与搜索词之间的跳转概率;
将跳转概率最高的搜索词作为所述搜索关键词。
8.根据权利要求1所述的方法,其特征在于,从实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词包括:
通过实时挖掘搜索日志,统计搜索词对应检索量、用户数,和检索量变化率;
根据实时统计的检索量、用户数,和检索量变化率,拟合搜索指数函数;
根据所述搜索指数函数,选择搜索词,作为所述搜索关键词。
9.根据权利要求8所述的方法,其特征在于,在根据所述搜索指数函数,选择搜索词,作为所述搜索关键词之前,从实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词还包括:
对所述搜索词进行过滤。
10.根据权利要求8所述的方法,其特征在于,在根据所述搜索指数函数,选择搜索词,作为所述搜索关键词之后,从实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词还包括:
对所述搜索关键词,添加热搜图片和/或热搜语音;
对所述热搜图片和/或热搜语音进行压缩,并存储压缩后的热搜图片和/或热搜语音。
11.根据权利要求1所述的方法,其特征在于,对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序包括:
根据点击率估计模型估计所述搜索关键词的点击率,其中,所述点击率估计模型由下式给出:
根据所述点击率对所述搜索关键词进行排序;
其中,CTRtemplate表示广告位阶段的点击率,CTRlu表示链接单元阶段的点击率,xi表示在广告位阶段所述搜索关键词的特征向量元素,wi表示在广告位阶段所述搜索关键词的特征向量元素对应的权重向量元素,xj表示在连接单元阶段所述搜索关键词的特征向量元素,wj表示在连接单元阶段所述搜索关键词的特征向量元素对应的权重向量元素。
12.根据权利要求11所述的方法,其特征在于,在根据点击率估计模型估计所述搜索关键词的点击率之前,对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序还包括:
根据用户历史行为,获取所述搜索关键词的特征向量;
根据所述特征向量及目标点击率,训练所述点击率估计模型。
13.一种搜索关键词的推送装置,其特征在于,包括:
获取模块,用于从至少一个数据源获取与用户的阅读上下文和场景相关的搜索关键词;
排序模块,用于对所述搜索关键词估计其对应的点击率,并根据估计得到的点击率对所述搜索关键词进行排序;
推送模块,用于根据所述排序的次序向用户的移动终端推送所述搜索关键词;
其中,所述获取模块具体用于:从用户历史日志、互联网网页和/或实时搜索日志中,挖掘与用户的阅读上下文和场景相关的搜索关键词。
14.根据权利要求13所述的装置,其特征在于,所述推送模块包括:
布局设计单元,用于根据移动终端的屏幕宽度,设计各搜索关键词的界面布局;
展现单元,用于根据所述界面布局,向用户展现所述搜索关键词、所述搜索关键词对应的热搜图片和/或所述搜索关键词对应的热搜语音。
15.根据权利要求13所述的装置,其特征在于,当从用户历史中日志挖掘与用户的阅读上下文和场景相关的搜索关键词之时,所述获取模块包括:
矩阵建立单元,用于根据用户关注主体、兴趣点和/或意图数据,建立关于用户标签和场景的关联矩阵;
关键词获取单元,用于根据用户标签和场景查询所述关联矩阵,获取所述搜索关键词。
16.根据权利要求13所述的装置,其特征在于,当从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,所述获取模块具体用于:
根据所述互联网网页中的文本,或者用户对互联网网页的点击关系,从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词。
17.根据权利要求16所述的装置,其特征在于,当根据所述互联网网页中的文本从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,所述获取模块包括:
网页获取单元,用于从用户历史日志中获取用户输入搜索词后所浏览的网页;
关键词提取单元,用于根据TF-IDF算法,从所述网页的文本中提取具有代表性的关键词;
关键词确定单元,用于将所述具有代表性的关键词作为所述搜索关键词。
18.根据权利要求16所述的装置,其特征在于,当根据用户对不同互联网网页的点击关系从互联网网页中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,所述获取模块包括:
搜索词跳转关系挖掘单元,用于根据用户在一次会话中不同搜索词之间的跳转关系,挖掘所述搜索关键词;或者
URL跳转关系挖掘单元,用于根据用户在一次会话中统一资源定位符URL与搜索词之间的跳转关系,挖掘所述搜索关键词。
19.根据权利要求18所述的装置,其特征在于,所述URL跳转关系挖掘单元具体用于:
统计URL与搜索词之间的一次跳转概率;
利用随机游走算法,根据所述一次跳转概率计算URL与搜索词之间的跳转概率;
将跳转概率最高的搜索词作为所述搜索关键词。
20.根据权利要求13所述的装置,其特征在于,当从实时搜索日志中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,所述获取模块包括:
统计单元,用于通过实时挖掘搜索日志,统计搜索词对应检索量、用户数,和检索量变化率;
拟合单元,用于根据实时统计的检索量、用户数,和检索量变化率,拟合搜索指数函数;
关键词选择单元,用于根据所述搜索指数函数,选择搜索词,作为所述搜索关键词。
21.根据权利要求20所述的装置,其特征在于,当从实时搜索日志中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,在根据所述搜索指数函数,选择搜索词,作为所述搜索关键词之前,所述获取模块还包括:
过滤单元,用于对所述搜索词进行过滤。
22.根据权利要求20所述的装置,其特征在于,当从实时搜索日志中挖掘与用户的阅读上下文和场景相关的搜索关键词之时,在根据所述搜索指数函数选择搜索词,作为所述搜索关键词之后,所述获取模块还包括:
多媒体添加单元,用于对所述搜索关键词,添加热搜图片和/或热搜语音;
多媒体存储单元,用于对所述热搜图片和/或热搜语音进行压缩,并存储压缩后的热搜图片和/或热搜语音。
23.根据权利要求13所述的装置,其特征在于,所述排序模块包括:
估计单元,用于根据点击率估计模型估计所述搜索关键词的点击率,其中,所述点击率估计模型由下式给出:
其中,CTRtemplate表示广告位阶段的点击率,CTRlu表示链接单元阶段的点击率,xi表示在广告位阶段所述搜索关键词的特征向量元素,wi表示在广告位阶段所述搜索关键词的特征向量元素对应的权重向量元素,xj表示在连接单元阶段所述搜索关键词的特征向量元素,wj表示在连接单元阶段所述搜索关键词的特征向量元素对应的权重向量元素;
排序单元,用于根据所述点击率对所述搜索关键词进行排序。
24.根据权利要求23所述的装置,其特征在于,所述排序模块还包括:
向量获取单元,用于在根据点击率估计模型估计所述搜索关键词的点击率之前,根据用户历史行为,获取所述搜索关键词的特征向量;
模型训练单元,用于在根据点击率估计模型估计所述搜索关键词的点击率之前,根据所述特征向量及目标点击率,训练所述点击率估计模型。
CN201510475975.4A 2015-08-05 2015-08-05 搜索关键词的推送方法和装置 Active CN105159930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510475975.4A CN105159930B (zh) 2015-08-05 2015-08-05 搜索关键词的推送方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510475975.4A CN105159930B (zh) 2015-08-05 2015-08-05 搜索关键词的推送方法和装置

Publications (2)

Publication Number Publication Date
CN105159930A CN105159930A (zh) 2015-12-16
CN105159930B true CN105159930B (zh) 2019-02-05

Family

ID=54800787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510475975.4A Active CN105159930B (zh) 2015-08-05 2015-08-05 搜索关键词的推送方法和装置

Country Status (1)

Country Link
CN (1) CN105159930B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718239B (zh) * 2016-01-27 2019-03-08 百度在线网络技术(北京)有限公司 一种语音输入的方法和装置
CN105956149B (zh) * 2016-05-12 2019-12-06 北京奇艺世纪科技有限公司 默认搜索词的推荐方法和装置
CN106294596A (zh) * 2016-07-29 2017-01-04 北京小米移动软件有限公司 信息搜索的方法及装置
CN106777282B (zh) 2016-12-29 2018-07-13 百度在线网络技术(北京)有限公司 相关搜索的排序方法和装置
CN108287834A (zh) * 2017-01-09 2018-07-17 百度在线网络技术(北京)有限公司 用于推送信息的方法、装置及计算设备
CN108345611B (zh) * 2017-01-24 2022-12-13 北京搜狗信息服务有限公司 一种地图搜索的运行监控方法、装置及电子设备
CN107224160A (zh) * 2017-06-30 2017-10-03 广东工业大学 一种用于资讯推送的智能镜子
CN109213551A (zh) * 2017-07-06 2019-01-15 阿里巴巴集团控股有限公司 一种用户界面处理方法及装置
CN107463704B (zh) * 2017-08-16 2021-05-07 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN110020309A (zh) * 2017-12-04 2019-07-16 北京搜狗科技发展有限公司 一种页面处理方法和装置
CN109003146B (zh) * 2018-08-31 2022-07-29 百度在线网络技术(北京)有限公司 业务数据推广方法、装置、终端和计算机可读存储介质
CN109063200B (zh) * 2018-09-11 2022-10-14 优视科技(中国)有限公司 资源搜索方法及其装置、电子设备、计算机可读介质
CN109587527B (zh) * 2018-11-09 2021-06-04 青岛聚看云科技有限公司 一种个性化视频推荐的方法及装置
CN110909182B (zh) * 2019-11-29 2023-05-09 北京达佳互联信息技术有限公司 多媒体资源搜索方法、装置、计算机设备及存储介质
CN110941766B (zh) * 2019-12-10 2023-10-20 北京字节跳动网络技术有限公司 一种信息推送的方法、装置、计算机设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577392A (zh) * 2013-11-15 2014-02-12 北京奇虎科技有限公司 基于当前浏览页面的关键词推送方法及装置
CN104750713A (zh) * 2013-12-27 2015-07-01 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064853B (zh) * 2011-10-20 2017-02-08 北京百度网讯科技有限公司 一种搜索建议生成方法、装置及系统
CN104216881A (zh) * 2013-05-29 2014-12-17 腾讯科技(深圳)有限公司 一种个性化标签的推荐方法及装置
CN104166700A (zh) * 2014-08-01 2014-11-26 百度在线网络技术(北京)有限公司 搜索词推荐方法及装置
CN104572889B (zh) * 2014-12-24 2016-10-05 深圳市腾讯计算机系统有限公司 一种搜索词推荐方法、装置和系统
CN104750873A (zh) * 2015-04-22 2015-07-01 百度在线网络技术(北京)有限公司 流行搜索词推送方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577392A (zh) * 2013-11-15 2014-02-12 北京奇虎科技有限公司 基于当前浏览页面的关键词推送方法及装置
CN104750713A (zh) * 2013-12-27 2015-07-01 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置

Also Published As

Publication number Publication date
CN105159930A (zh) 2015-12-16

Similar Documents

Publication Publication Date Title
CN105045901B (zh) 搜索关键词的推送方法和装置
CN105159930B (zh) 搜索关键词的推送方法和装置
KR101667344B1 (ko) 검색 결과들을 제공하는 방법 및 시스템
CN102542003B (zh) 用于顾及当用户在搜索引擎中提出查询时的用户意图的点击模型
US9348935B2 (en) Systems and methods for augmenting a keyword of a web page with video content
US9569541B2 (en) Evaluating preferences of content on a webpage
WO2017190610A1 (zh) 目标用户定向方法、装置和计算机存储介质
US8180778B1 (en) Generating action trails from web history
CN103955842B (zh) 一种面向大规模媒体数据的在线广告推荐系统及方法
US9798820B1 (en) Classification of keywords
US20150379079A1 (en) Personalizing Query Rewrites For Ad Matching
CN107424043A (zh) 一种产品推荐方法及装置,电子设备
US20120130969A1 (en) Generating context information for a search session
Paranjape et al. Improving website hyperlink structure using server logs
US20130054672A1 (en) Systems and methods for contextualizing a toolbar
JP2015537259A (ja) クリックスルー率に基づく検索結果の順位付け
WO2011146874A2 (en) Microsite models
US20120290974A1 (en) Systems and methods for providing a discover prompt to augmented content of a web page
CN104933239A (zh) 一种基于混合模型的个性化职位信息推荐系统及实现方法
CN103064945A (zh) 基于本体的情境搜索方法
CN101650731A (zh) 基于用户反馈的赞助搜索广告的建议关键词生成方法
EP2628097A1 (en) Systems and methods for using a behavior history of a user to augment content of a webpage
US20100010982A1 (en) Web content characterization based on semantic folksonomies associated with user generated content
US20140280133A1 (en) Structured Data to Aggregate Analytics
CN105095625B (zh) 点击率预估模型建立方法、装置及信息提供方法、系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant