CN103699700B - 一种搜索引导的生成方法、系统及相关服务器 - Google Patents

一种搜索引导的生成方法、系统及相关服务器 Download PDF

Info

Publication number
CN103699700B
CN103699700B CN201410021098.9A CN201410021098A CN103699700B CN 103699700 B CN103699700 B CN 103699700B CN 201410021098 A CN201410021098 A CN 201410021098A CN 103699700 B CN103699700 B CN 103699700B
Authority
CN
China
Prior art keywords
search
web page
keyword
content
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410021098.9A
Other languages
English (en)
Other versions
CN103699700A (zh
Inventor
张尧
杨帆
周曜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201410021098.9A priority Critical patent/CN103699700B/zh
Publication of CN103699700A publication Critical patent/CN103699700A/zh
Application granted granted Critical
Publication of CN103699700B publication Critical patent/CN103699700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种搜索引导的生成方法、系统及相关服务器,用以减少检索过程中用户到达目标网页的路径,满足用户快速、直接的检索需求。搜索引导的生成方法,包括:接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索直达的请求,在所述请求中携带有当前的搜索内容;在保存有网页标题及其链接地址的搜索直达数据库中查找与当前的搜索内容匹配的网页标题;根据查找到的网页标题生成搜索直达结果后返回给浏览器进行展示,所述搜索直达结果中包括数量不超过预设搜索直达条数阈值的网页标题及其链接地址。采用该方案,避免了检索过程中用户不必要的搜索查询,减少了检索过程中用户到达目标网页的路径,满足了用户快速、直接的检索需求。

Description

一种搜索引导的生成方法、系统及相关服务器
技术领域
本发明涉及搜索技术领域,尤其涉及一种搜索引导的生成方法、系统及相关服务器。
背景技术
随着信息技术的飞速发展,当今社会进入了信息爆炸时代,人们越来越多地借助网络来寻找自己需要的信息,因此,检索成为人们工作、生活中不可或缺的一部分。人们通常使用搜索引擎来进行检索,搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将与用户检索相关的信息展示给用户的系统。
搜索引擎的基本工作原理包括如下三个过程:
1、抓取网页。每个独立的搜索引擎都有自身的网页抓取程序爬虫(Spider)。Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
2、处理网页。搜索引擎抓取到网页后,需要做大量的预处理工作,才能提供检索服务。其中,最重要的是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度和丰富度等。
3、提供检索服务。用户输入搜索关键词进行搜索查询,搜索引擎从索引库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和链接地址外,还会提供一段来自网页的摘要以及其他信息。
在用户进行检索的过程中,需要用户在搜索框内输入搜索关键词,普通用户不愿意输入太长或者过于复杂的关键词。为了能使用户尽快完成关键词的输入,节省用户的输入时间,在用户输入关键词的部分内容(本发明实施例中简称搜索内容)后,会采用提供搜索建议的方式,在搜索框自动下拉栏中提供若干个建议的关键词供用户选择,用户选择符合自己预期的关键词进行搜索查询,之后到达搜索结果页面,从而无需用户手动输入完整的搜索关键词,还能在一定程度上纠正用户输入的错别字或拼写错误,为用户提供了方便的检索服务。
可见,搜索建议是搜索引擎的一种人性化服务,在用户输入搜索内容的时候,通过“建议”来提示、指引、补全搜索关键词。现有技术中,搜索建议的生成方法包括:在搜索建议的词典中记录一些关键词热度较高的关键词;根据用户当前在搜索框内已输入的关键词的部分内容,在词典中找到相匹配的关键词,供用户选择。关键词热度反映了用户对该关键词的关注度,一般来说,被用户选择越多的关键词,其热度越高。
本发明人在发明过程中发现,搜索建议是一种简单的基于用户输入的搜索内容,对记录有关键词热度较高的关键词的词典进行匹配和查询的服务。用户通过搜索建议,仅能做到补全搜索框内的搜索关键词,然后需要进行一次搜索查询,才能前往搜索结果页面;最后用户在搜索结果页面中,寻找自己需要的结果,前往目标网页。可见,现有基于搜索建议的检索过程,需要经过较多路径才能最终到达用户期望浏览的目标网页,无法满足用户快速、直接的检索需求。
发明内容
本发明实施例提供一种搜索引导的生成方法、系统及相关服务器,用以减少检索过程中用户到达目标网页的路径,满足用户快速、直接的检索需求。
本发明实施例提供的搜索引导的生成方法,包括:
接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索直达的请求,在所述请求中携带有当前的搜索内容;
在保存有网页标题及其链接地址的搜索直达数据库中查找与当前的搜索内容匹配的网页标题;
根据查找到的网页标题生成搜索直达结果后返回给浏览器进行展示,所述搜索直达结果中包括数量不超过预设搜索直达条数阈值的网页标题及其链接地址。
其中,在搜索直达数据库中查找与当前的搜索内容匹配的网页标题之前,所述搜索引导的生成方法,还包括:
确认当前的搜索内容是否满足预设的精确需求条件。
其中,所述当前的搜索内容满足预设的精确需求条件进一步包括:
确定当前的搜索内容所属的类型;
如果当前的搜索内容的类型属于精确类需求类型,则确认当前的搜索内容满足预设的精确需求条件,所述精确类需求类型通过用户搜索行为分析确定,所述精确类需求类型是指用户希望快速、直接到达目标网页的检索需求所对应搜索内容的类型。
进一步的,所述搜索直达数据库中还保存有网页标题对应的网址热度,所述网址热度是指用户对该网页标题所标识网页的关注度;以及所述根据查找到的网页标题生成搜索直达结果进一步包括:
如果查找到多个网页标题,对各网页标题按照网址热度由高到低的顺序进行排序,从排序结果中挑选一个网址热度最高的网页标题;并
将挑选出的网页标题及其链接地址生成搜索直达结果。
其中,所述网址热度根据当网页标题及其链接地址作为搜索直达结果被推荐后,用户的使用通过点击该链接地址达到目标网页的次数确定。
进一步的,所述搜索引导的生成方法还包括:
接收在搜索框内的搜索内容发生变化时所述浏览器发送的推荐搜索建议的请求,在所述请求中携带有当前的搜索内容;
在保存有关键词的搜索建议数据库中查找与当前的搜索内容匹配的关键词;
根据查找到的关键词生成搜索建议结果后返回给浏览器进行展示,所述搜索建议结果中包括数量不超过预设搜索建议条数阈值的关键词,以及所述浏览器将所述搜索建议结果与所述搜索直达结果合并处理后进行展示。
其中,所述搜索建议数据库中还保存有关键词对应的关键词热度;以及所述根据查找到的关键词生成搜索建议结果进一步包括:
如果查找到多个关键词,对各关键词按照关键词热度由高到低的顺序进行排序,从排序结果中挑选位置靠前、且数量不超过所述搜索建议条数阈值的关键词;
将挑选出的关键词生成搜索建议结果。
其中,所述关键词热度根据当关键词作为搜索建议结果被推荐后,用户通过点击该关键词进行搜索查询的次数确定。
本发明实施例提供的搜索引导的生成系统,包括:
搜索直达数据库,用于保存网页标题及其链接地址;
搜索直达服务器,用于接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索直达的请求,在所述请求中携带有当前的搜索内容;在所述搜索直达数据库中查找与当前的搜索内容匹配的网页标题;根据查找到的网页标题生成搜索直达结果后返回给浏览器进行展示,所述搜索直达结果中包括数量不超过预设搜索直达条数阈值的网页标题及其链接地址。
其中,所述搜索直达服务器,还用于在搜索直达数据库中查找与当前的搜索内容匹配的网页标题之前,确认当前的搜索内容是否满足预设的精确需求条件。
进一步的,所述搜索引导的生成系统,还包括:
搜索建议数据库,用于保存关键词;
搜索建议服务器,用于接收在搜索框内的搜索内容发生变化时所述浏览器发送的推荐搜索建议的请求,在所述请求中携带有当前的搜索内容;在所述搜索建议数据库中查找与当前的搜索内容匹配的关键词;根据查找到的关键词生成搜索建议结果后返回给浏览器进行展示,所述搜索建议结果中包括数量不超过预设搜索建议条数阈值的关键词,所述浏览器将所述搜索建议结果与所述搜索直达结果合并处理后进行展示。
本发明实施例提供的搜索直达服务器,包括:
接收模块,用于接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索直达的请求,在所述请求中携带有当前的搜索内容;
匹配模块,用于在保存有网页标题及其链接地址的搜索直达数据库中查找与当前的搜索内容匹配的网页标题;
生成模块,用于根据查找到的网页标题生成搜索直达结果后返回给浏览器,所述搜索直达结果中包括数量不超过预设搜索直达条数阈值的网页标题及其链接地址。
进一步的,所述搜索直达服务器,还包括:
确认模块,用于确认当前的搜索内容满足预设的精确需求条件时,触发所述匹配模块。
其中,所述确认模块进一步包括:
确定子模块,用于确定当前的搜索内容所属的类型;
判断子模块,用于判断当前的搜索内容的类型是否属于精确类需求类型,并输出判断结果,所述精确类需求类型通过用户搜索行为分析确定,所述精确类需求类型是指用户希望快速、直接到达目标网页的检索需求所对应搜索内容的类型;
触发子模块,用于当判断子模块输出的判断结果为是时,触发所述匹配模块。
本发明实施例提供的搜索引导的生成方法、系统及相关服务器,采用向用户提供搜索直达的方式提供搜索引导,浏览器在搜索框内的搜索内容发生变化时,发送推荐搜索直达的请求,搜索直达服务器通过匹配和查询,生成搜索直达结果后返回给浏览器进行展示,由于搜索直达结果包括网页标题及其链接地址,用户可以根据网页上展示的搜索直达结果直接前往到相应内容的网页上,从而避免了检索过程中用户不必要的搜索查询,减少了检索过程中用户到达目标网页的路径,满足了用户快速、直接的检索需求。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例一中搜索引导的生成方法流程图;
图2为本发明实施例二中搜索引导的生成方法流程图;
图3为本发明实施例三中搜索引导的生成方法流程图;
图4为本发明实施例三中搜索建议结果与搜索直达结果在网页上展示的示意图;
图5为本发明实施例四中搜索引导的生成系统结构框图;
图6为本发明实施例五中搜索直达服务器的结构框图。
具体实施方式
为了避免检索过程中用户不必要的搜索查询,减少检索过程中用户到达目标网页的路径,满足用户快速、直接的检索需求,本发明实施例提供了一种搜索引导的生成方法、系统及相关服务器,以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例一
本发明实施例相对于搜索建议,提供了一种新的搜索引擎的个性化服务:搜索直达。搜索直达的目的就是为了避免检索过程中用户不必要的搜索查询,让用户能够直接前往目标网页。
首先对搜索直达的词典的数据存储结构进行说明。主要的数据项包括:网页标题及其链接地址。网页按照展示内容可以分为首页、List(列表)页面、 Detail(详细)页面。网页标题即网址的名称,例如淘宝首页;链接地址即网址的链接,例如www.taobao.com。
接着对搜索直达提供的服务进行说明。在用户输入搜索关键词的部分内容(本发明实施例中简称搜索内容)后,会采用提供搜索直达的方式,在搜索框自动下拉栏中以超链接的形式提供若干个可以直达的网页标题供用户选择,用户选择符合自己预期的网页标题,根据该网页标题的链接地址可以直接前往到相应内容的网页上。为了满足用户快速、直接的检索需求,搜索直达结果一般不超过三条,较佳的,搜索直达结果仅包括一条。
本发明实施例中,将提供搜索直达的服务器称之为搜索直达服务器,相应的,将搜索直达的词典称之为搜索直达数据库。下面,对搜索直达数据库的数据存储结构进行举例说明,如表1所示,可以看到搜索直达数据库中保存有网页标题及其链接地址。
表1
网页标题(title) 链接地址(url)
淘宝首页 www.taobao.com
京东首页 www.jd.com
中彩网首页 www.zhcw.com
基于搜索直达的介绍,本发明实施例提供一种搜索引导的生成方法,如图 1所示,包括步骤:
S101、搜索直达服务器接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索直达的请求,在该请求中携带有当前的搜索内容。
用户通过在网页搜索框内输入搜索内容,而每当搜索框内的搜索内容发生变化时,浏览器均会向搜索直达服务器发送推荐搜索直达的请求。
S102、搜索直达服务器在保存有网页标题及其链接地址的搜索直达数据库中查找与当前的搜索内容匹配的网页标题。
搜索直达服务器接收到推荐搜索直达的请求后,根据其中携带的搜索内容,可以通过拼音字母前缀匹配方式或中文匹配方式或者其它方式,在搜索直达数据库的“网页标题”中进行查找。
S103、搜索直达服务器根据查找到的网页标题生成搜索直达结果后返回给浏览器进行展示,其中,搜索直达结果中包括数量不超过预设搜索直达条数阈值的网页标题及其链接地址。
具体实施中,搜索直达条数阈值一般设置为不超过“三”的自然数,可选地,搜索直达条数阈值设置为“一”。在搜索直达条数阈值设置为“一”的情况下,如果查找到多个网页标题,可以随机选择任意一个生成搜索直达结果。可选地,为了进一步保证搜索直达结果的高到达率,可以在搜索直达的词典的数据项中引入一新的数据项:网页标题对应的网址热度,网址热度反映了用户对该网页标题所标识网页的关注度,一般来说,被用户选择越多的网址,其热度越高,网址热度直接关系着该网页标题所标识的网页是否是用户希望展示的。对搜索直达数据库的数据存储结构进行举例说明,如表2所示,可以看到搜索直达数据库中保存有网页标题及其链接地址和网址热度。
表2
网页标题(title) 链接地址(url) 网址热度
淘宝首页 www.taobao.com N1
京东首页 www.jd.com N2
中彩网首页 www.zhcw.com N3
在此基础上,如果查找到多个网页标题,则对各网页标题按照网址热度由高到低的顺序进行排序,从排序结果中挑选一个网址热度最高的网页标题;并将挑选出的网页标题及其链接地址生成搜索直达结果。具体实施中,网址热度一般是根据当网页标题及其链接地址作为搜索直达结果被推荐后,用户通过点击该链接地址到达目标网页的次数确定的。例如“淘宝首页www.taobao.com”作为搜索直达结果被推荐后,用户通过点击“www.taobao.com”到达淘宝首页的次数为N1次,则相应的,网页标题“淘宝首页”对应的网址热度为N1
本发明实施例提供的搜索引导的生成方法,采用向用户提供搜索直达的方式提供搜索引导,浏览器在搜索框内的搜索内容发生变化时,发送推荐搜索直达的请求,搜索直达服务器通过匹配和查询,生成搜索直达结果后返回给浏览器进行展示,由于搜索直达结果包括网页标题及其链接地址,用户可以根据网页上展示的搜索直达结果直接前往到相应内容的网页上,从而避免了检索过程中用户不必要的搜索查询,减少了检索过程中用户到达目标网页的路径,满足了用户快速、直接的检索需求。
实施例二
依据此实施例,仅将精确需求作为搜索直达的使用场景。其中,精确需求是通过用户搜索行为分析确定的,将某些特殊类型的检索需求划归为精确需求,从而定向为用户提供搜索直达的服务。常见的用户搜索行为包括:用户搜索时所使用的搜索内容、用户自行输入的搜索关键词、用户利用搜索建议所选择的关键词、用户在搜索结果页面中的点击行为等等。基于用户搜索行为的历史数据,对用户的搜索行为进行分析,预测哪些检索需求是用户希望快速、直接到达目标网页的检索需求,本发明实施例中将预测出的检索需求所对应搜索内容的类型统称为精确类需求类型,则精确类需求类型是指用户希望快速、直接到达目标网页的检索需求所对应搜索内容的类型。用户搜索行为的历史数据一般从服务器端的用户日志中获取,还可以从客户端所记录的数据(例如浏览器所生成的cookie)中获取。
通过用户搜索行为分析,确定出的精确类需求类型包括如下几种:
a)网址类需求类型,例如用户输入的搜索内容为:百度、淘宝、京东等,也就是说通过用户搜索行为分析发现,如果用户输入的搜索内容为“淘宝”,用户一般倾向于快速、直接到达“淘宝首页www.taobao.com”;
b)信息查询类需求类型,例如用户输入的搜索内容为:彩票中奖结果,车辆违章查询等,也就是说通过用户搜索行为分析发现,如果用户输入的搜索内容为“彩票中奖结果”,用户一般倾向于快速、直接到达“彩票中奖结果展示页面”;
c)垂直内容类需求类型,例如用户输入的搜索内容为:看的某部电视剧,玩的某款游戏,看的某篇小说等,也就是说通过用户搜索行为分析发现,如果用户输入的搜索内容为“电视剧A”,用户一般倾向于快速、直接到达“电视剧A的视频播放列表页面”。
如图2所示,其示出了依据本发明一个实施例的搜索引导的生成方法,该方法包括如下步骤:
S201、搜索直达服务器接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索直达的请求,在该请求中携带有当前的搜索内容。
用户通过在网页搜索框内输入搜索内容,而每当搜索框内的搜索内容发生变化时,浏览器均会向搜索直达服务器发送推荐搜索直达的请求。
S202、搜索直达服务器判断当前的搜索内容是否满足预设的精确需求条件,如果是,则继续执行S203,如果否,则流程结束,也就是说搜索直达服务器不会生成搜索直达结果返回给浏览器。
具体实施中,判断当前的搜索内容满足预设的精确需求条件的方法,具体包括如下步骤:
步骤一、确定当前的搜索内容所属的类型;
具体实施中,根据当前的搜索内容确定所属类型的方法,采用现有技术中常用的关键词分类方法即可。一种常用的关键词分类方法包括:预先根据各种已确定类型的关键词样本建立关键词分类模型,基于关键词分类模型确定当前的关键词所属的类型。
步骤二、如果当前的搜索内容的类型属于精确类需求类型,则确认当前的搜索内容满足预设的精确需求条件,其中,精确类需求类型通过用户搜索行为分析确定;否则,当前的搜索内容不满足预设的精确需求条件。
具体实施中,可以在搜索直达数据库中预先配置精确类需求类型列表,记录通过用户搜索行为分析确定出的各精确类需求类型,例如精确类需求类型列表如表3所示,其中记录如下内容:网址类需求类型、信息查询类需求类型、垂直内容类需求类型。
表3
标识 精确类需求类型
001 网址类需求类型
002 信息查询类需求类型
003 垂直内容类需求类型
则可以通过判断步骤一中确定出的当前的搜索内容的类型是否在预先配置的精确类需求类型列表中,从而判断出当前的搜索内容的类型是否属于精确类需求类型。
S203、搜索直达服务器在保存有网页标题及其链接地址的搜索直达数据库中查找与当前的搜索内容匹配的网页标题。
搜索直达服务器接收到搜索内容后,可以通过拼音字母前缀匹配方式或中文匹配方式或者其他方式,在搜索直达数据库的“网页标题”中进行查找。
S204、搜索直达服务器根据查找到的网页标题生成搜索直达结果后返回给浏览器进行展示,其中,搜索直达结果中包括数量不超过预设搜索直达条数阈值的网页标题及其链接地址。
本发明实施例提供的搜索引导的生成方法,将搜索直达的使用场景限定为精确需求,采用定向为用户提供搜索直达的方式提供搜索引导,浏览器在搜索框内的搜索内容发生变化时,发送推荐搜索直达的请求,搜索直达服务器在确定当前的搜索内容满足精确需求条件的前提下,通过匹配和查询,生成搜索直达结果后返回给浏览器进行展示,由于搜索直达结果包括网页标题及其链接地址,用户可以根据网页上展示的搜索直达结果直接前往到相应内容的网页上,从而避免了检索过程中用户不必要的搜索查询,减少了检索过程中用户到达目标网页的路径,满足了用户快速、直接的检索需求;同时,仅为用户的精确需求定向提供搜索直达的服务,使得搜索直达结果更具有针对性,有效提升了搜索直达结果的到达率。
实施例三
本发明实施例将搜索建议和搜索直达相结合,采用同时为用户提供搜索直达和搜索建议的方式提供搜索引导,使得为用户提供的搜索引导更加完备,同时兼顾用户快速、直接,以及全面、有效的检索需求。
首先对搜索建议的词典的数据存储结构进行说明。主要的数据项包括:关键词。关键词即能够帮助用户完成搜索建议的内容,例如:双11去哪儿买东西。一般情况下,在搜索建议的词典中收录的均是一些关键词热度较高的关键词,可选地,搜索建议的词典中的数据项还包括关键词对应的关键词热度,关键词热度直接关系着该关键词是否是用户希望展示的。具体实施中,关键词热度一般是根据当关键词作为搜索建议结果被推荐后,用户通过点击该关键词进行搜索查询的次数确定的。例如关键词“爸爸去哪儿”作为搜索建议结果被推荐后,用户通过点击“爸爸去哪儿”进行搜索查询之后到达搜索结果页面的次数为M1次,则相应的,关键词“爸爸去哪儿”对应的关键词热度为M1。搜索直达提供的服务及相关说明请参见实施例一,具体不再赘述。
本发明实施例中,将提供搜索建议的服务器称之为搜索建议服务器,相应的,将搜索建议的词典称之为搜索建议数据库。下面,对搜索直达数据库的数据存储结构进行举例说明,如表4所示,可以看到搜索建议数据库中保存有关键词及对应的关键词热度。搜索建议数据库中也可以仅保存关键词这一数据项,而没有对应的关键词热度这一数据项,具体的数据存储结构不再举例说明。
表4
关键词 关键词热度
爸爸去哪儿 M1
爸爸去哪儿湖南卫视 M2
爸爸我们去哪儿 M3
基于搜索直达和搜索建议的介绍,本发明实施例提供一种搜索引导的生成方法,如图3所示,包括如下步骤:
S301、用户在网页搜索框内输入搜索内容;
S302、在搜索框内的搜索内容发生变化时,浏览器向搜索直达服务器发送推荐搜索直达的请求;
S303、搜索直达服务器在保存有网页标题及其链接地址的搜索直达数据库中查找与当前的搜索内容匹配的网页标题,根据查找到的网页标题生成搜索直达结果后返回给浏览器;
具体实施中,也可以仅对精确需求提供搜索直达的服务,具体不再赘述,请参见实施例二;
S304、在搜索框内的搜索内容发生变化时,浏览器向搜索建议服务器发送推荐搜索建议的请求;
S305、搜索建议服务器在保存有关键词的搜索建议数据库中查找与当前的搜索内容匹配的关键词;并根据查找到的关键词生成搜索建议结果后返回给浏览器,其中,搜索建议结果中包括数量不超过预设搜索建议条数阈值的关键词。
按照经验值,搜索建议条数阈值一般设置为“十”,如果查找到多个关键词,可以随机选择任意十个生成搜索建议结果。可选地,为了进一步保证搜索建议结果的高使用率,通常在搜索建议的词典的数据项中引入新的数据项:关键词热度,则可以对各关键词按照关键词热度由高到低的顺序进行排序,从排序结果中挑选位置靠前、且数量不超过搜索建议条数阈值的关键词;并将挑选出的关键词生成搜索建议结果。
需要说明的是,为了描述方便为各个步骤设置了编号,但是步骤的编号并不严格限定步骤之间的时序关系。具体实施中,S302、S303与S304、305一般情况下是同步并行执行的,也就是说,在搜索框内的搜索内容发生变化时,浏览器会同时向搜索直达服务器发送推荐搜索直达的请求、以及向搜索建议服务器发送推荐搜索建议的请求,搜索直达服务器和搜索建议服务器根据各自接收到的请求执行相应处理,分别向浏览器返回搜索直达结果和搜索建议结果。
S306、浏览器将搜索建议结果与搜索直达结果合并处理后展示在网页上。
为了便于理解,举例说明搜索建议结果与搜索直达结果在网页上展示的情况。如图4所示,假设用户在网页搜索框内输入了搜索内容“baba”,一个方面,搜索直达服务器接收到浏览器发送的携带有该搜索内容“baba”的推荐搜索直达的请求后,通过拼音字母前缀匹配方式在搜索直达数据库中进行匹配和查询;搜索直达数据库中的数据项包括网页标题及其链接地址和网址热度,假设通过拼音字母匹配方式搜索直达服务器查找到若干与当前的搜索内容“baba”匹配的网页标题,例如分别为“爸爸去哪儿综艺最新在线观看”、“爸爸去哪儿主题曲”、“爸爸去哪儿第一期”等,再根据各网页标题对应的网址热度,选取网址热度最高的一个网页标题及其链接地址生成搜索直达结果;假设网页标题“爸爸去哪儿综艺最新在线观看”对应的网址热度最高,则最终返回的搜索直达结果中包括一条搜索直达,其中,网页标题为“爸爸去哪儿综艺最新在线观看”,并且以超链接的形式提供了该网页标题的链接地址,可以使用户直接前往到提供“爸爸去哪儿”在线视频的网页上。另一方面,搜索建议服务器接收到浏览器发送的携带该搜索内容“baba”的推荐搜索建议的请求后,通过拼音字母前缀匹配方式在搜索建议数据库中进行匹配和查询;搜索建议数据库中的数据项包括关键词和关键词热度,假设通过拼音字母前缀匹配方式搜索建议服务器查找到若干与当前的搜索内容“baba”匹配的关键词,例如“爸爸去哪儿”、“爸爸去哪儿湖南卫视”、“爸爸我们去哪儿”等;则根据各关键词对应的关键词热度,按照关键词热度从高到低的顺序选取排序靠前的十个关键词生成搜索建议结果;则最终返回的搜索建议结果中包括十条搜索建议,例如“爸爸去哪儿”、“爸爸去哪儿湖南卫视”、“爸爸我们去哪儿”等建议的关键词,供用户选择符合自己预期的关键词进行搜索查询。
本发明实施例提供的搜索引导的生成方法,采用同时向用户提供搜索直达和搜索建议的方式提供搜索引导,浏览器在搜索框内的搜索内容发生变化时,发送推荐搜索直达的请求和推荐搜索建议的请求,搜索直达服务器通过匹配和查询,生成搜索直达结果,搜索建议服务器通过匹配和查询,生成搜索建议结果,最后由浏览器对搜索直达结果和搜索建议结果合并处理后进行展示。由于搜索直达结果包括网页标题及其链接地址,用户可以根据网页上展示的搜索直达结果直接前往到相应内容的网页上,同时用户可以根据网页上展示的搜索建议结果选择符合自己预期的关键词进行搜索查询,从而兼顾了用户快速、直接,以及全面、有效的检索需求。
实施例四
依据本发明的一个实施例,还提供了一种搜索引导的生成系统,由于该系统解决问题的原理与搜索引导的生成方法相一致,因此该系统的实施可以参见方法的实施,重复之处不在赘述。
如图5所示,本发明实施例提供的搜索引导的生成系统,包括:
搜索直达数据库501,用于保存网页标题及其链接地址;
搜索直达服务器502,用于接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索直达的请求,在该请求中携带有当前的搜索内容;在搜索直达数据库501中查找与当前的搜索内容匹配的网页标题;根据查找到的网页标题生成搜索直达结果后返回给浏览器进行展示,其中,搜索直达结果中包括数量不超过预设搜索直达条数阈值的网页标题及其链接地址。
可选地,本发明实施例提供的搜索引导的生成系统中,搜索直达服务器502 ,还用于在搜索直达数据库501 中查找与当前的搜索内容匹配的网页标题之前,确认当前的搜索内容是否满足预设的精确需求条件。
可选地,本发明实施例提供的搜索引导的生成系统,还包括:
搜索建议数据库503,用于保存关键词;
搜索建议服务器504,用于接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索建议的请求,在该请求中携带有当前的搜索内容;在搜索建议数据库504中查找与当前的搜索内容匹配的关键词;根据查找到的关键词生成搜索建议结果后返回给浏览器进行展示,其中,搜索建议结果中包括数量不超过预设搜索建议条数阈值的关键词,以及浏览器将搜索建议结果与搜索直达结果合并处理后进行展示。
具体实施中,搜索直达服务器502和搜索建议服务器504可以分别设置于两组物理服务器集群中,也可以分别设置于两台物理服务器中,还可以合并设置于一台物理服务器中。
本发明实施例还提供了搜索直达服务器的一种可能结构,如图6所示,包括:
接收模块601,用于接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索直达的请求,在该请求中携带有当前的搜索内容;
匹配模块602,用于在保存有网页标题及其链接地址的搜索直达数据库中查找与当前的搜索内容匹配的网页标题;
生成模块603,用于根据查找到的网页标题生成搜索直达结果后返回给浏览器,其中,搜索直达结果中包括数量不超过预设搜索直达条数阈值的网页标题及其链接地址。
可选地,该搜索直达服务器,还包括:
确认模块604,用于确认当前的搜索内容满足预设的精确需求条件时,触发匹配模块602。
其中,确认模块604的一种可能结构,具体包括:
确定子模块,用于确定当前的搜索内容所属的类型;
判断子模块,用于判断当前的搜索内容的类型是否属于精确类需求类型,并输出判断结果,其中,精确类需求类型通过用户搜索行为分析确定,精确类需求类型是指用户希望快速、直接到达目标网页的检索需求所对应搜索内容的类型;
触发子模块,用于当判断子模块输出的判断结果为是时,触发匹配模块 602。
本申请的实施例所提供的搜索直达服务器的功能可通过计算机程序实现。本领域技术人员应该能够理解,上述的模块划分方式仅是众多模块划分方式中的一种,如果划分为其他模块或不划分模块,只要搜索直达服务器具有上述功能,都应该在本申请的保护范围之内。
本领域的技术人员应明白,本发明的实施例可提供为方法、系统、设备或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (11)

1.一种搜索引导的生成方法,包括:
接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索直达的请求,在所述请求中携带有当前的搜索内容;
确认当前的搜索内容是否满足预设的精确需求条件,其中精确类需求类型通过用户搜索行为分析确定;
如果确认当前的搜索内容满足预设的精确需求条件,在保存有网页标题及其链接地址的搜索直达数据库中查找与当前的搜索内容匹配的网页标题,所述搜索直达数据库中保存的网页标题对应的网页包括首页、列表页面和/或详细页面;
根据查找到的网页标题生成搜索直达结果后返回给浏览器进行展示,所述搜索直达结果中包括数量不超过预设搜索直达条数阈值的网页标题及其链接地址。
2.如权利要求1所述的方法,其中,所述确认当前的搜索内容是否满足预设的精确需求条件进一步包括:
确定当前的搜索内容所属的类型;
如果当前的搜索内容的类型属于精确类需求类型,则确认当前的搜索内容满足预设的精确需求条件,所述精确类需求类型是指用户希望快速、直接到达目标网页的检索需求所对应搜索内容的类型。
3.如权利要求1或2的方法,其中,所述搜索直达数据库中还保存有网页标题对应的网址热度,所述网址热度是指用户对该网页标题所标识网页的关注度;以及所述根据查找到的网页标题生成搜索直达结果进一步包括:
如果查找到多个网页标题,对各网页标题按照网址热度由高到低的顺序进行排序,从排序结果中挑选一个网址热度最高的网页标题;
将挑选出的网页标题及其链接地址生成搜索直达结果。
4.如权利要求3所述的方法,其中,所述网址热度根据当网页标题及其链接地址作为搜索直达结果被推荐后,用户通过点击该链接地址到达目标网页的次数确定。
5.如权利要求1或2所述的方法,还包括:
接收在搜索框内的搜索内容发生变化时所述浏览器发送的推荐搜索建议的请求,在所述请求中携带有当前的搜索内容;
在保存有关键词的搜索建议数据库中查找与当前的搜索内容匹配的关键词;
根据查找到的关键词生成搜索建议结果后返回给浏览器进行展示,所述搜索建议结果中包括数量不超过预设搜索建议条数阈值的关键词,以及所述浏览器将所述搜索建议结果与所述搜索直达结果合并处理后进行展示。
6.如权利要求5所述的方法,其中,所述搜索建议数据库中还保存有关键词对应的关键词热度;以及所述根据查找到的关键词生成搜索建议结果进一步包括:
如果查找到多个关键词,对各关键词按照关键词热度由高到低的顺序进行排序,从排序结果中挑选位置靠前、且数量不超过所述搜索建议条数阈值的关键词;
将挑选出的关键词生成搜索建议结果。
7.如权利要求6所述的方法,其特征在于,所述关键词热度根据当关键词作为搜索建议结果被推荐后,用户通过点击该关键词进行搜索查询的次数确定。
8.一种搜索引导的生成系统,包括:
搜索直达数据库,用于保存网页标题及其链接地址;
搜索直达服务器,用于接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索直达的请求,在所述请求中携带有当前的搜索内容;确认当前的搜索内容是否满足预设的精确需求条件,其中精确类需求类型通过用户搜索行为分析确定;如果确认当前的搜索内容满足预设的精确需求条件,在所述搜索直达数据库中查找与当前的搜索内容匹配的网页标题,所述搜索直达数据库中保存的网页标题对应的网页包括首页、列表页面和/或详细页面;根据查找到的网页标题生成搜索直达结果后返回给浏览器进行展示,所述搜索直达结果中包括数量不超过预设搜索直达条数阈值的网页标题及其链接地址。
9.如权利要求8所述的系统,还包括:
搜索建议数据库,用于保存关键词;
搜索建议服务器,用于接收在搜索框内的搜索内容发生变化时所述浏览器发送的推荐搜索建议的请求,在所述请求中携带有当前的搜索内容;在所述搜索建议数据库中查找与当前的搜索内容匹配的关键词;根据查找到的关键词生成搜索建议结果后返回给浏览器进行展示,所述搜索建议结果中包括数量不超过预设搜索建议条数阈值的关键词,所述浏览器将所述搜索建议结果与所述搜索直达结果合并处理后进行展示。
10.一种搜索直达服务器,包括:
接收模块,用于接收在搜索框内的搜索内容发生变化时浏览器发送的推荐搜索直达的请求,在所述请求中携带有当前的搜索内容;
确认模块,用于确认当前的搜索内容是否满足预设的精确需求条件,在确认当前的搜索内容满足预设的精确需求条件时,触发匹配模块,其中精确类需求类型通过用户搜索行为分析确定;
所述匹配模块,用于在保存有网页标题及其链接地址的搜索直达数据库中查找与当前的搜索内容匹配的网页标题,所述搜索直达数据库中保存的网页标题对应的网页包括首页、列表页面和/或详细页面;
生成模块,用于根据查找到的网页标题生成搜索直达结果后返回给浏览器,所述搜索直达结果中包括数量不超过预设搜索直达条数阈值的网页标题及其链接地址。
11.如权利要求10所述的搜索直达服务器,所述确认模块进一步包括:
确定子模块,用于确定当前的搜索内容所属的类型;
判断子模块,用于判断当前的搜索内容的类型是否属于精确类需求类型,并输出判断结果,所述精确类需求类型是指用户希望快速、直接到达目标网页的检索需求所对应搜索内容的类型;
触发子模块,用于当判断子模块输出的判断结果为是时,触发所述匹配模块。
CN201410021098.9A 2014-01-16 2014-01-16 一种搜索引导的生成方法、系统及相关服务器 Active CN103699700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410021098.9A CN103699700B (zh) 2014-01-16 2014-01-16 一种搜索引导的生成方法、系统及相关服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410021098.9A CN103699700B (zh) 2014-01-16 2014-01-16 一种搜索引导的生成方法、系统及相关服务器

Publications (2)

Publication Number Publication Date
CN103699700A CN103699700A (zh) 2014-04-02
CN103699700B true CN103699700B (zh) 2017-10-13

Family

ID=50361228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410021098.9A Active CN103699700B (zh) 2014-01-16 2014-01-16 一种搜索引导的生成方法、系统及相关服务器

Country Status (1)

Country Link
CN (1) CN103699700B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104965826B (zh) * 2014-04-18 2019-04-16 腾讯科技(深圳)有限公司 基于浏览器的检索方法及检索装置
CN104036005A (zh) * 2014-06-19 2014-09-10 百度在线网络技术(北京)有限公司 搜索建议信息展现方法和装置
CN104036035B (zh) * 2014-06-30 2018-06-01 百度在线网络技术(北京)有限公司 一种历史搜索建议提示方法及装置
CN104598507B (zh) * 2014-08-14 2018-03-30 腾讯科技(北京)有限公司 信息搜索方法及装置
CN104462299A (zh) * 2014-11-27 2015-03-25 百度在线网络技术(北京)有限公司 资源提供方法、装置和系统
CN104462551B (zh) * 2014-12-25 2019-06-14 北京奇虎科技有限公司 基于热词的即时搜索方法及装置
CN104462557B (zh) * 2014-12-25 2018-04-17 北京奇虎科技有限公司 基于搜索历史记录的即时搜索方法及装置
CN104765811A (zh) * 2015-04-02 2015-07-08 北京奇虎科技有限公司 实现搜索提示的装置、系统及方法
CN106921703B (zh) * 2015-12-25 2020-11-27 阿里巴巴集团控股有限公司 跨境数据同步的方法、系统,以及境内和境外数据中心
CN108073588B (zh) * 2016-11-09 2021-07-30 北京国双科技有限公司 栏目信息提取方法和装置
CN106844609A (zh) * 2017-01-17 2017-06-13 百度在线网络技术(北京)有限公司 一种搜索方法及装置
CN108153560B (zh) * 2017-12-11 2021-06-08 北京小米移动软件有限公司 数据下发方法及装置
CN111723282A (zh) * 2019-09-17 2020-09-29 上海寻梦信息技术有限公司 搜索处理方法及系统、电子设备及存储介质
CN113010766B (zh) * 2019-12-18 2023-08-18 腾讯科技(深圳)有限公司 一种信息搜索的方法、装置及存储介质
CN112860155B (zh) * 2020-07-10 2022-06-03 浙江口碑网络技术有限公司 一种搜索引导的处理方法及装置
CN113051392A (zh) * 2021-04-30 2021-06-29 中国银行股份有限公司 知识推送方法及装置
CN113239258B (zh) * 2021-05-19 2023-06-27 北京百度网讯科技有限公司 提供查询建议的方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101539949A (zh) * 2008-11-13 2009-09-23 北京搜狗科技发展有限公司 一种网址补全提示的方法及装置
CN102436448A (zh) * 2010-09-29 2012-05-02 腾讯科技(深圳)有限公司 搜索方法和系统
CN103092976A (zh) * 2013-01-28 2013-05-08 百度在线网络技术(北京)有限公司 一种网页搜索方法、系统及装置
CN103366011A (zh) * 2013-07-26 2013-10-23 北京奇虎科技有限公司 通过浏览器地址栏访问认证网址的方法、及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101539949A (zh) * 2008-11-13 2009-09-23 北京搜狗科技发展有限公司 一种网址补全提示的方法及装置
CN102436448A (zh) * 2010-09-29 2012-05-02 腾讯科技(深圳)有限公司 搜索方法和系统
CN103092976A (zh) * 2013-01-28 2013-05-08 百度在线网络技术(北京)有限公司 一种网页搜索方法、系统及装置
CN103366011A (zh) * 2013-07-26 2013-10-23 北京奇虎科技有限公司 通过浏览器地址栏访问认证网址的方法、及装置

Also Published As

Publication number Publication date
CN103699700A (zh) 2014-04-02

Similar Documents

Publication Publication Date Title
CN103699700B (zh) 一种搜索引导的生成方法、系统及相关服务器
US11907240B2 (en) Method and system for presenting a search result in a search result card
KR100898454B1 (ko) 통합 검색 서비스 시스템 및 방법
CN105912669B (zh) 用于补全搜索词及建立个体兴趣模型的方法及装置
US9135370B2 (en) Method and apparatus of generating update parameters and displaying correlated keywords
CN101911042B (zh) 用户的浏览器历史的相关性排序
KR101708448B1 (ko) 예측 쿼리 제안 캐싱
CN102822815B (zh) 用于利用浏览器历史进行动作建议的方法和系统
US20070244863A1 (en) Systems and methods for performing searches within vertical domains
US20130282709A1 (en) Method and system for query suggestion
US20090125504A1 (en) Systems and methods for visualizing web page query results
US20080288588A1 (en) Method and system for searching using image based tagging
US20090077065A1 (en) Method and system for information searching based on user interest awareness
US20060059440A1 (en) System for organization, display, and navigation of digital information
KR20170018832A (ko) 사용자 관계 데이터 결합에 기초하는 검색
US20070244862A1 (en) Systems and methods for ranking vertical domains
Liu et al. Query expansion based on clustered results
CN103186666B (zh) 基于收藏进行搜索的方法、装置与设备
US9330071B1 (en) Tag merging
CN109952571B (zh) 基于上下文的图像搜索结果
Baeza-Yates et al. The new frontier of web search technology: Seven challenges
CN107357911A (zh) 一种文本输入方法及装置
US9110943B2 (en) Identifying an image for an entity
JP2009533767A (ja) 垂直ドメイン内で検索を実行するシステム及び方法
US20090234838A1 (en) System, method, and/or apparatus for subset discovery

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220715

Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.

TR01 Transfer of patent right