CN108197242A - 搜索推荐词的推送方法、装置及服务器 - Google Patents

搜索推荐词的推送方法、装置及服务器 Download PDF

Info

Publication number
CN108197242A
CN108197242A CN201711478919.1A CN201711478919A CN108197242A CN 108197242 A CN108197242 A CN 108197242A CN 201711478919 A CN201711478919 A CN 201711478919A CN 108197242 A CN108197242 A CN 108197242A
Authority
CN
China
Prior art keywords
search
url
word
search term
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711478919.1A
Other languages
English (en)
Inventor
彭睿棋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201711478919.1A priority Critical patent/CN108197242A/zh
Publication of CN108197242A publication Critical patent/CN108197242A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种搜索推荐词的推送方法,包括:接收用户对与第一搜索词对应的任一搜索结果项的触发操作,所述任一搜索结果项包括第一URL;响应于所述触发操作,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词;将所述第二搜索词作为所述第一搜索词的搜索推荐词进行推送。同时,本发明还提供了一种搜索推荐词的推送装置及服务器。本发明提供的方案,能够使用户在不需要手动重新输入搜索词的情况下快速地找到目标搜索内容,减少了用户的搜索成本,有效提高用户的搜索效率,增强了用户的搜索体验。

Description

搜索推荐词的推送方法、装置及服务器
技术领域
本发明涉及互联网技术领域,具体而言,本发明涉及一种搜索推荐词的推送方法及装置及服务器。
背景技术
随着计算机的普及以及信息工程的日益发展,从网上获取信息已经成为人们日常生活和工作的重要途径,互联网如今已成为资源不断丰富的平台,整个互联网逐渐成为一个信息量超大的资源存储空间。此时怎样有效而又快捷地从海量数据中获取所需的信息就成为一件困难的事情,搜索引擎的出现有效解决了“信息丰富,获取困难”的问题。
用户输入搜索查询词query,搜索引擎就能为用户提供许多与用户输入的query相关的网页,以此来满足用户的搜索需求。但是当用户输入query后,在搜素引擎提供的与query相关的搜索结果项中都没有找到用户满意的内容,就只能重新改写query进行二次搜索,之后用户才有可能找到满意的结果。对于用户来说搜索过程曲折费时,搜索成本较高,用户的搜索体验并不好。
发明内容
本发明针对现有技术的缺点,提供了一种搜索推荐词的推送方法,能够为用户提供搜索推荐词,使用户在不需要手动重新输入搜索词的情况下快速地找到目标搜索内容。
本发明实施例提供了一种搜索推荐词的推送方法,包括:
接收用户对与第一搜索词对应的任一搜索结果项的触发操作,所述任一搜索结果项包括第一URL;
响应于所述触发操作,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词;
将所述第二搜索词作为所述第一搜索词的搜索推荐词进行推送。
进一步地,所述在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词,包括:
将所述第一搜索词与所述第一URL的关联关系作为查询依据,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词。
进一步地,所述将所述第一搜索词与所述第一URL的关联关系作为查询依据,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词,包括:
根据所述第一搜索词与所述第一URL的关联关系,在预存储的索引数据库中查询确定与所述第一URL具有关联关系的、除所述第一搜索词之外的至少一个搜索词,并将其作为与所述第一URL具有关联关系的第二搜索词。
进一步地,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词的步骤之前,还包括:
获取多个用户的历史搜索行为数据;
根据所述历史搜索行为数据建立索引数据库,所述索引数据库包括各个搜索词及各自对应的URL之间的关联关系。
进一步地,所述历史搜索行为数据包括多个用户的历史搜索词,多个用户对与各个历史搜索词对应的历史搜索结果项的触发操作,所述历史搜索结果项包括历史URL。
进一步地,所述根据所述历史搜索行为数据建立索引数据库,包括:
确定与任一历史搜索词对应的历史URL;
确定任一历史搜索词跳转至与其对应的历史URL的跳转概率;
针对任一历史搜索词,按照跳转概率将与其对应的历史URL进行排序,并依据排序结果确定与任一历史搜索词具有关联关系的历史URL;
根据已确定的历史搜索词与历史URL的关联信息来建立索引数据库。
进一步地,所述确定与任一历史搜索词对应的历史URL,包括:
确定出与任一历史搜索词直接对应的历史URL以及间接对应的历史URL。
进一步地,所述确定出与任一历史搜索词直接对应的历史URL,包括:
若在一次历史搜索过程中,用户通过历史搜索词跳转到目标URL的跳转次数为一次,则确定该目标URL为该历史搜索词直接对应的历史URL;
所述确定出与任一历史搜索词间接对应的历史URL,包括:
若在一次搜索过程中,用户通过历史搜索词跳转到目标URL的跳转次数大于一次,则确定该目标URL为该历史搜索词间接对应的历史URL。
进一步地,所述根据已确定的历史搜索词与历史URL的关联信息来建立索引数据库,还包括:
对历史搜索词进行去重及预定信息过滤处理,并对历史URL进行归一化处理。
本发明实施例还提供了一种搜索推荐词的推送装置,包括以下模块:
触发操作接收模块,用于接收用户对与第一搜索词对应的任一搜索结果项的触发操作,所述任一搜索结果项包括第一URL;
搜索推荐词确定模块,用于响应于所述触发操作,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词;
搜索推荐词推送模块,用于将所述第二搜索词作为所述第一搜索词的搜索推荐词进行推送。
进一步地,所述搜索推荐词确定模块,还用于将所述第一搜索词与所述第一URL的关联关系作为查询依据,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词。
进一步地,所述搜索推荐词确定模块,还用于根据所述第一搜索词与所述第一URL的关联关系,在预存储的索引数据库中查询确定与所述第一URL具有关联关系的、除所述第一搜索词之外的至少一个搜索词,并将其作为与所述第一URL具有关联关系的第二搜索词。
进一步地,还包括:
历史搜索行为数据获取模块,用于获取多个用户的历史搜索行为数据;
索引数据库建立模块,用于根据所述历史搜索行为数据建立索引数据库,所述索引数据库包括各个搜索词及各自对应的URL之间的关联关系。
进一步地,所述历史搜索行为数据包括多个用户的历史搜索词,多个用户对与各个历史搜索词对应的历史搜索结果项的触发操作,所述历史搜索结果项包括历史URL。
进一步地,所述索引数据库建立模块,包括:
历史URL确定子模块,用于确定与任一历史搜索词对应的历史URL;
跳转概率确定子模块,用于确定任一历史搜索词跳转至与其对应的历史URL的跳转概率;
关联历史URL确定子模块,用于针对任一历史搜索词,按照跳转概率将与其对应的历史URL进行排序,并依据排序结果确定与任一历史搜索词具有关联关系的历史URL;
索引数据库子模块,用于根据已确定的历史搜索词与历史URL的关联信息来建立索引数据库。
进一步地,所述历史URL确定子模块,包括:
直接对应历史URL确定单元,用于确定出与任一历史搜索词直接对应的历史URL;
间接对应历史URL确定单元,用于确定出与任一历史搜索词间接对应的历史URL。
进一步地,所述直接对应历史URL确定单元,还用于在一次历史搜索过程中,用户通过历史搜索词跳转到目标URL的跳转次数为一次时,确定该目标URL为该历史搜索词直接对应的历史URL;
所述间接对应历史URL确定单元,还用于在一次搜索过程中,用户通过历史搜索词跳转到目标URL的跳转次数大于一次时,确定该目标URL为该历史搜索词间接对应的历史URL。
进一步地,所述索引数据库子模块,还包括:
处理单元,用于对历史搜索词进行去重及预定信息过滤处理,并对历史URL进行归一化处理。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述搜索推荐词的推送方法。
本发明实施例还提供了一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述的搜索推荐词的推送方法。
本发明实施例中,通过接收用户对与第一搜索词对应的任一搜索结果项的触发操作,所述任一搜索结果项包括第一URL;响应于所述触发操作,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词;并将第二搜索词作为第一搜索词的搜索推荐词进行推送,使得用户能够在不需要手动重新输入搜索词的情况下即可以获取与其搜索意图很可能相关的搜索推荐词,并利用搜索推荐词快速地找到目标搜索内容,减少了用户的搜索成本,有效提高用户的搜索效率,增强了用户的搜索体验。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为搜索推荐词的推送方法流程图;
图2为搜索词与URL间关联关系的示意图;
图3为在一个实施例中建立索引数据库的方法流程图;
图4为在一个优选实施例中建立索引数据库的具体流程图;
图5为搜索推荐词的推送装置的结构示意图;
图6为在一个实施例中建立索引数据库结构示意图;
图7为在一个优选实施例中建立索引数据库结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PerSonal CommunicationS Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(PerSonal Digital ASSiStant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PoSitioning SyStem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本发明实施例提供了一种搜索推荐词的推送方法,该方法的流程图如图1所示,具体包括以下步骤:
步骤S110:接收用户对与第一搜索词对应的任一搜索结果项的触发操作,所述任一搜索结果项包括第一URL;
步骤S120:响应于所述触发操作,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词;
步骤S130:将所述第二搜索词作为所述第一搜索词的搜索推荐词进行推送。
应用本发明实施例提供的搜索推荐词的推送方法能够获得以下有益效果:用户能够在不需要手动重新输入搜索词的情况下即可以获取与其搜索意图很可能相关的搜索推荐词,并利用搜索推荐词快速地找到目标搜索内容,减少了用户的搜索成本,有效提高用户的搜索效率,增强了用户的搜索体验。
以下针对以上各个步骤的具体实现做进一步的说明。
步骤S110:接收用户对与第一搜索词对应的任一搜索结果项的触发操作,所述任一搜索结果项包括第一URL。
具体地,当用户需要搜索时,接收用户的第一搜索词以及用户对与第一搜索词对应的搜索结果项的触发操作,所述任一搜索结果项包括第一URL。其中,所述触发操作可以是用户使用鼠标对所述搜索结果项的点击操作,或是用户通过触摸屏对所述搜索结果项的点击操作。
步骤S120:响应于所述触发操作,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词。
具体地,所述在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词,包括:
将所述第一搜索词与所述第一URL的关联关系作为查询依据,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词。
所述将所述第一搜索词与所述第一URL的关联关系作为查询依据,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词,包括:
根据所述第一搜索词与所述第一URL的关联关系,在预存储的索引数据库中查询确定与所述第一URL具有关联关系的、除所述第一搜索词之外的至少一个搜索词,并将其作为与所述第一URL具有关联关系的第二搜索词。
具体地,如图2所示,预存储的索引数据库中包括搜索词q1、q2,u1、u2代表用户点击过的URL,q1与u1具有关联关系,q2与u1和u2均具有关联关系;当检测到用户输入q1并点击了u1的触发操作之后,将q1与u1的关联关系作为查询依据,在预存储的索引数据库中确定与u1具有关联关系、除q1外的搜索词为q2,即用户通过搜索q2来找到u2很可能会满足用户的查询需求,因此将q2作为搜索推荐词进行推送后,用户利用q2就很有可能找到与用户搜索意图相关的搜索结果。
其中,若为用户提供的搜索推荐词包括了用户已经搜索过的搜索词,这样的情况会导致用户的搜索体验变得很差,因此,提供给用户的搜索推荐词不能包含用户已经输入并搜索过的搜索词。
步骤S130:将所述第二搜索词作为所述第一搜索词的搜索推荐词进行推送。
本发明实施例还包括建立索引数据库的过程,如图3所示,包括步骤S210和步骤S220。
步骤S210:获取多个用户的历史搜索行为数据。
具体地,所述历史搜索行为数据包括多个用户的历史搜索词,多个用户对与各个历史搜索词对应的历史搜索结果项的触发操作,所述历史搜索结果项包括历史URL。
优选地,为了保证为用户提供的搜索推荐词被用户接受的概率更高,所述历史搜索行为数据包括的所述多个用户的历史搜索词被用户搜索的次数需大于预设搜索次数,所述历史URL被用户点击的次数大于预设点击次数。其中,所述预设搜索次数和所述预设点击次数可以由开发者预先配置。
步骤S220:根据所述历史搜索行为数据建立索引数据库,所述索引数据库包括各个搜索词及各自对应的URL之间的关联关系。
具体地,如图4所示,步骤S220包括步骤S310,步骤S320,步骤S330和步骤S340。
步骤S310:确定与任一历史搜索词对应的历史URL。
具体地,所述确定与任一历史搜索词对应的历史URL,包括:
确定出与任一历史搜索词直接对应的历史URL以及间接对应的历史URL。
具体地,确定出与任一历史搜索词直接对应的历史URL,包括:
若在一次历史搜索过程中,用户通过历史搜索词跳转到目标URL的跳转次数为一次,则确定该目标URL为该历史搜索词直接对应的历史URL。比如,若有用户在一次搜索过程中通过q1搜索,并在与q1对应的搜索结果项中点击访问了u1,那么用户u1是q1直接对应的历史URL。其中,搜索过程包括用户在预定时间内做出的搜索行为、点击URL的行为,搜索过程的预定时间可由开发者预先配置。
确定出与任一历史搜索词间接对应的历史URL,包括:
若在一次搜索过程中,用户通过历史搜索词跳转到目标URL的跳转次数大于一次,则确定该目标URL为该历史搜索词间接对应的历史URL。比如,若有用户在一次搜索过程中通过q1搜索,并在与q1对应的搜索结果项中点击访问了u1,然后用户重新输入q2,进行搜索,并在与q2对应的搜索结果项中访问了u2,那么u2是q1间接对应的历史URL。步骤S320:确定任一历史搜索词跳转至与其对应的历史URL的跳转概率。
具体地,假如用户通过q1能够搜索到u1、u2、u3,共3个URL。若有100个用户在一次搜索过程中通过q1进行搜索,其中80个用户点击访问了u1,20个用户点击访问了u3,那么用户从q1跳转到u1的跳转概率为80%,从q1跳转到u3的概率为20%,用户从q1跳转到u2的概率为0。
在上述例子的基础上,假如100个用户在一次搜索过程中通过q1进行搜索,其中80个用户点击访问了u1,之后有80个用户重新输入q2,搜索出u4、u5,并有70个用户访问了u4,10个用户访问了u5,则用户从q1间接跳转到u4的跳转概率为70%,从q1间接跳转到u5的概率为10%。
步骤S330:针对任一历史搜索词,按照跳转概率将与其对应的历史URL进行排序,并依据排序结果确定与任一历史搜索词具有关联关系的历史URL。
具体地,为了保证为用户提供的搜索推荐词被用户接受的概率更大,通过将确定的与任一搜索词具有对应关系的URL按照跳转概率进行排序,再从中选取跳转概率高的URL。
步骤S340:根据已确定的历史搜索词与历史URL的关联信息来建立索引数据库。
具体地,所述索引数据库包括多个已确定的历史搜索词,以及与所述历史搜索词对应的历史URL。还包括与所述历史URL具有关联关系的搜索词。
具体地,步骤S340,还包括:
对历史搜索词进行去重及预定信息过滤处理,并对历史URL进行归一化处理。
具体地,若历史搜索词中存在重复的情况,需要将多余的重复历史搜索词删除,并将多余的重复历史搜索词所对应的历史URL统一对应到保留的历史搜索词上。若有历史URL存在重复的情况,需要将多余的重复历史URL删除,并将多余的重复历史URL所对应的历史搜索词统一对应到保留的历史URL上。
优选地,为了规范搜索环境,设立预定信息过滤处理机制。若存在历史搜索词的信息与预定信息一致,则不对该历史搜索词进行分析,包括不分析所述历史搜索词对应的URL,,并且不为用户提供包含预定信息的搜索推荐词。
本发明实施例还提供了一种搜索推荐词的推送装置,如图5所示,包括以下模块:
触发操作接收模块110,用于接收用户对与第一搜索词对应的任一搜索结果项的触发操作,所述任一搜索结果项包括第一URL;
搜索词确定模块120,用于响应于所述触发操作,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词;
搜索推荐词推送模块130,用于将所述第二搜索词作为所述第一搜索词的搜索推荐词进行推送。
以下针对以上各个模块进行详细分析。
触发操作接收模块110,用于接收用户对与第一搜索词对应的任一搜索结果项的触发操作,所述任一搜索结果项包括第一URL;
搜索词确定模块120,用于响应于所述触发操作,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词;
具体地,所述搜索词确定模块120,还用于将所述第一搜索词与所述第一URL的关联关系作为查询依据,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词。
更具体地,所述搜索词确定模块120,还用于根据所述第一搜索词与所述第一URL的关联关系,在预存储的索引数据库中查询确定与所述第一URL具有关联关系的、除所述第一搜索词之外的至少一个搜索词,并将其作为与所述第一URL具有关联关系的第二搜索词。
搜索推荐词推送模块130,用于将所述第二搜索词作为所述第一搜索词的搜索推荐词进行推送。
如图6所示,本发明实施例提供的搜索词推荐装置,还包括历史搜索行为数据获取模块210和索引数据库建立模块220。
历史搜索行为数据获取模块210,用于获取多个用户的历史搜索行为数据。
具体地,所述历史搜索行为数据获取模块210获取的历史搜索行为数据包括多个用户的历史搜索词,多个用户对与各个历史搜索词对应的历史搜索结果项的触发操作,所述历史搜索结果项包括历史URL。
索引数据库建立模块220,用于根据所述历史搜索行为数据建立索引数据库,所述索引数据库包括各个搜索词及各自对应的URL之间的关联关系。
具体地,如图7所示,所述索引数据库建立模块,包括历史URL确定子模块310,跳转概率确定子模块320,关联历史URL确定子模块330以及索引数据库子模块340。
具体地,所述历史URL确定子模块310,包括:直接对应历史URL确定单元和间接对应历史URL确定单元。
直接对应历史URL确定单元,用于确定出与任一历史搜索词直接对应的历史URL。
具体地,所述直接对应历史URL确定单元,还用于在一次历史搜索过程中,用户通过历史搜索词跳转到目标URL的跳转次数为一次时,确定该目标URL为该历史搜索词直接对应的历史URL。
间接对应历史URL确定单元,用于确定出与任一历史搜索词间接对应的历史URL。
具体地,所述间接对应历史URL确定单元,还用于在一次搜索过程中,用户通过历史搜索词跳转到目标URL的跳转次数大于一次时,确定该目标URL为该历史搜索词间接对应的历史URL。
所述索引数据库子模块,还包括:
处理单元,用于对历史搜索词进行去重及预定信息过滤处理,并对历史URL进行归一化处理。
跳转概率确定子模块320,用于确定任一历史搜索词跳转至与其对应的历史URL的跳转概率;
关联历史URL确定子模块330,用于针对任一历史搜索词,按照跳转概率将与其对应的历史URL进行排序,并依据排序结果确定与任一历史搜索词具有关联关系的历史URL;
索引数据库子模块340,用于根据已确定的历史搜索词与历史URL的关联信息来建立索引数据库。
具体地,所述索引数据库子模块340,还包括:
处理单元,用于对历史搜索词进行去重及预定信息过滤处理,并对历史URL进行归一化处理。
通过本发明实施例提供的搜索词推荐装置,能够让用户在不需要手动重新输入搜索词的情况下,利用搜索推荐词快速地找到目标搜索内容,减少了用户的搜索成本,有效提高用户的搜索效率,增强了用户的搜索体验。
本发明实施例还提供了一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述搜索推荐词的推送方法。
所述服务器能够让用户在不需要手动重新输入搜索词的情况下,利用搜索推荐词快速地找到目标搜索内容,减少了用户的搜索成本,有效提高用户的搜索效率,增强了用户的搜索体验。
本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSS Memory,随即存储器)、EPROM(EraSable ProgrammableRead-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically EraSableProgrammable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种搜索推荐词的推送方法,其特征在于,包括:
接收用户对与第一搜索词对应的任一搜索结果项的触发操作,所述任一搜索结果项包括第一URL;
响应于所述触发操作,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词;
将所述第二搜索词作为所述第一搜索词的搜索推荐词进行推送。
2.如权利要求1所述的搜索推荐词的推送方法,其特征在于,所述在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词,包括:
将所述第一搜索词与所述第一URL的关联关系作为查询依据,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词。
3.如权利要求1-2所述的搜索推荐词的推送方法,其特征在于,所述将所述第一搜索词与所述第一URL的关联关系作为查询依据,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词,包括:
根据所述第一搜索词与所述第一URL的关联关系,在预存储的索引数据库中查询确定与所述第一URL具有关联关系的、除所述第一搜索词之外的至少一个搜索词,并将其作为与所述第一URL具有关联关系的第二搜索词。
4.如权利要求1-3所述的搜索推荐词的推送方法,其特征在于,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词的步骤之前,还包括:
获取多个用户的历史搜索行为数据;
根据所述历史搜索行为数据建立索引数据库,所述索引数据库包括各个搜索词及各自对应的URL之间的关联关系。
5.如权利要求1-4所述的搜索推荐词的推送方法,其特征在于,所述历史搜索行为数据包括多个用户的历史搜索词,多个用户对与各个历史搜索词对应的历史搜索结果项的触发操作,所述历史搜索结果项包括历史URL。
6.如权利要求1-5所述的搜索推荐词的推送方法,其特征在于,所述根据所述历史搜索行为数据建立索引数据库,包括:
确定与任一历史搜索词对应的历史URL;
确定任一历史搜索词跳转至与其对应的历史URL的跳转概率;
针对任一历史搜索词,按照跳转概率将与其对应的历史URL进行排序,并依据排序结果确定与任一历史搜索词具有关联关系的历史URL;
根据已确定的历史搜索词与历史URL的关联信息来建立索引数据库。
7.如权利要求1-6所述的搜索推荐词的推送方法,其特征在于,所述确定与任一历史搜索词对应的历史URL,包括:
确定出与任一历史搜索词直接对应的历史URL以及间接对应的历史URL。
8.一种搜索推荐词的推送装置,其特征在于,包括以下模块:
触发操作接收模块,用于接收用户对与第一搜索词对应的任一搜索结果项的触发操作,所述任一搜索结果项包括第一URL;
搜索推荐词确定模块,用于响应于所述触发操作,在预存储的索引数据库中确定与所述第一URL具有关联关系的第二搜索词;
搜索推荐词推送模块,用于将所述第二搜索词作为所述第一搜索词的搜索推荐词进行推送。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现权利要求1至9任一项所述的搜索推荐词的推送方法。
10.一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述的搜索推荐词的推送方法。
CN201711478919.1A 2017-12-29 2017-12-29 搜索推荐词的推送方法、装置及服务器 Pending CN108197242A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711478919.1A CN108197242A (zh) 2017-12-29 2017-12-29 搜索推荐词的推送方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711478919.1A CN108197242A (zh) 2017-12-29 2017-12-29 搜索推荐词的推送方法、装置及服务器

Publications (1)

Publication Number Publication Date
CN108197242A true CN108197242A (zh) 2018-06-22

Family

ID=62586572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711478919.1A Pending CN108197242A (zh) 2017-12-29 2017-12-29 搜索推荐词的推送方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN108197242A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190049A (zh) * 2018-11-02 2019-01-11 北京字节跳动网络技术有限公司 关键词推荐方法、系统、电子设备和计算机可读介质
CN109492082A (zh) * 2018-11-02 2019-03-19 北京字节跳动网络技术有限公司 下拉词推荐方法、装置、电子设备及存储介质
CN110442593A (zh) * 2019-08-12 2019-11-12 四川长虹电器股份有限公司 基于用户搜索信息跨应用共享的方法
CN110737823A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 访问意图挖掘方法及装置
CN111324694A (zh) * 2020-01-22 2020-06-23 中国人民大学 一种查询词推荐系统和方法
CN111653328A (zh) * 2020-06-04 2020-09-11 医渡云(北京)技术有限公司 病历信息推送方法、装置、存储介质及电子设备
CN114595403A (zh) * 2022-03-07 2022-06-07 北京字节跳动网络技术有限公司 一种搜索结果展示方法、装置、计算机设备和存储介质
CN114756751A (zh) * 2022-04-18 2022-07-15 北京字节跳动网络技术有限公司 推荐词确定方法、装置、电子设备和存储介质
WO2022227866A1 (zh) * 2021-04-26 2022-11-03 北京字节跳动网络技术有限公司 信息展示的方法、装置以及非易失性计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080085990A (ko) * 2007-03-21 2008-09-25 주식회사 케이티프리텔 추천검색어 제공 방법 및 시스템
KR100892990B1 (ko) * 2008-09-19 2009-04-10 김수현 검색사이트의 자동비교 검색시스템 및 검색방법
CN103714088A (zh) * 2012-10-09 2014-04-09 深圳市世纪光速信息技术有限公司 搜索词获取方法、服务器、搜索词推荐方法及系统
CN104715069A (zh) * 2015-03-31 2015-06-17 北京奇虎科技有限公司 一种搜索推荐词的处理方法和装置
CN105138614A (zh) * 2015-08-07 2015-12-09 百度在线网络技术(北京)有限公司 在搜索结果页面进行信息展现的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080085990A (ko) * 2007-03-21 2008-09-25 주식회사 케이티프리텔 추천검색어 제공 방법 및 시스템
KR100892990B1 (ko) * 2008-09-19 2009-04-10 김수현 검색사이트의 자동비교 검색시스템 및 검색방법
CN103714088A (zh) * 2012-10-09 2014-04-09 深圳市世纪光速信息技术有限公司 搜索词获取方法、服务器、搜索词推荐方法及系统
CN104715069A (zh) * 2015-03-31 2015-06-17 北京奇虎科技有限公司 一种搜索推荐词的处理方法和装置
CN105138614A (zh) * 2015-08-07 2015-12-09 百度在线网络技术(北京)有限公司 在搜索结果页面进行信息展现的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭世龙等: "基于随机游走模型的关键词推荐算法", 《产业与科技论坛》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737823B (zh) * 2018-07-03 2022-06-24 百度在线网络技术(北京)有限公司 访问意图挖掘方法及装置
CN110737823A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 访问意图挖掘方法及装置
CN109190049A (zh) * 2018-11-02 2019-01-11 北京字节跳动网络技术有限公司 关键词推荐方法、系统、电子设备和计算机可读介质
CN109492082A (zh) * 2018-11-02 2019-03-19 北京字节跳动网络技术有限公司 下拉词推荐方法、装置、电子设备及存储介质
CN110442593B (zh) * 2019-08-12 2022-02-01 四川长虹电器股份有限公司 基于用户搜索信息跨应用共享的方法
CN110442593A (zh) * 2019-08-12 2019-11-12 四川长虹电器股份有限公司 基于用户搜索信息跨应用共享的方法
CN111324694A (zh) * 2020-01-22 2020-06-23 中国人民大学 一种查询词推荐系统和方法
CN111324694B (zh) * 2020-01-22 2023-10-10 中国人民大学 一种查询词推荐系统和方法
CN111653328A (zh) * 2020-06-04 2020-09-11 医渡云(北京)技术有限公司 病历信息推送方法、装置、存储介质及电子设备
CN111653328B (zh) * 2020-06-04 2023-03-21 医渡云(北京)技术有限公司 病历信息推送方法、装置、存储介质及电子设备
WO2022227866A1 (zh) * 2021-04-26 2022-11-03 北京字节跳动网络技术有限公司 信息展示的方法、装置以及非易失性计算机存储介质
CN114595403A (zh) * 2022-03-07 2022-06-07 北京字节跳动网络技术有限公司 一种搜索结果展示方法、装置、计算机设备和存储介质
CN114756751A (zh) * 2022-04-18 2022-07-15 北京字节跳动网络技术有限公司 推荐词确定方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN108197242A (zh) 搜索推荐词的推送方法、装置及服务器
CN108804532B (zh) 一种查询意图的挖掘和查询意图的识别方法、装置
US10261973B2 (en) System and method for causing downloads of applications based on user intents
US7664744B2 (en) Query categorizer
CN110619076B (zh) 一种搜索词推荐方法、装置、计算机及存储介质
CN103699669B (zh) 一种浏览器中进行消息推送的方法和一种浏览器终端
CN109564571A (zh) 利用搜索上下文的查询推荐方法及系统
CN106170104B (zh) 视频精彩片段的确定方法、装置和服务器
US20110208715A1 (en) Automatically mining intents of a group of queries
CN102306171A (zh) 一种用于提供网络访问建议和网络搜索建议的方法与设备
CN104699737A (zh) 用于管理搜索的方法和系统
CN109657140A (zh) 信息推送方法、装置、计算机设备及存储介质
CN102663071B (zh) 一种浏览器中的搜索方法及装置
CN103617196B (zh) 推荐网址的方法、浏览器、服务器及系统
CN103778116A (zh) 一种信息的推荐方法和系统
CN105740460A (zh) 网页搜集推荐方法和装置
CN106407377A (zh) 基于人工智能的搜索方法和装置
CN103955480A (zh) 一种用于确定用户所对应的目标对象信息的方法与设备
CN110399555A (zh) 基于大数据的精准推荐云下载服务系统
CN102663111A (zh) 一种信息获取方法和设备
CN106528861A (zh) 一种添加内链的方法及装置
US8103649B2 (en) Search system and search method
CN103646034B (zh) 一种基于内容可信的Web搜索引擎系统及搜索方法
CN102693267A (zh) 扩大搜索结果
JP5144185B2 (ja) 情報検索システム及び情報検索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180622

RJ01 Rejection of invention patent application after publication