CN102004794B - 搜索引擎系统及其实现方法 - Google Patents

搜索引擎系统及其实现方法 Download PDF

Info

Publication number
CN102004794B
CN102004794B CN 201010592251 CN201010592251A CN102004794B CN 102004794 B CN102004794 B CN 102004794B CN 201010592251 CN201010592251 CN 201010592251 CN 201010592251 A CN201010592251 A CN 201010592251A CN 102004794 B CN102004794 B CN 102004794B
Authority
CN
China
Prior art keywords
answer
question
search engine
client
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201010592251
Other languages
English (en)
Other versions
CN102004794A (zh
Inventor
牛章鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN 201010592251 priority Critical patent/CN102004794B/zh
Publication of CN102004794A publication Critical patent/CN102004794A/zh
Application granted granted Critical
Publication of CN102004794B publication Critical patent/CN102004794B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种搜索引擎系统包括:搜索引擎,用于接收包含有查询词的查询请求,根据所述查询请求执行搜索并获得搜索结果列表;提问处理模块,用于将所述查询词生成提问请求;问答通信模块,用于将所述提问请求发送给问答系统,并从问答系统获取与所述提问请求相关联的答案;合成模块,用于将所述搜索结果列表和所述答案合成后返回给客户端。本发明的搜索引擎系统不仅能够返回给用户搜索结果列表,还能够与问答系统互动并返回与用户查询需求相关的问题的直接答案,从而提高了搜索的准确率,并且给用户提供了更为便利的查询服务。

Description

搜索引擎系统及其实现方法
技术领域
本发明涉及搜索引擎技术,尤其涉及一种可与提供问答互动平台的问答系统互动的搜索引擎系统及其实现方法。
背景技术
随着互联网上信息的飞速增长,网络上充斥了越来越多的冗余信息,而对于在网络上搜寻自己所需要信息的互联网用户而言,面对这些漫无边际的信息无疑像大海捞针。搜索引擎的出现无疑在一定程度上为用户的搜索需求带来了很大便利。搜索引擎是一种在网络上应用的软件系统,其以一定的策略在网络上搜集和发现信息,并在对信息进行处理和组织后,为用户提供互联网上的信息查询服务。通常,这种软件系统提供一个网页界面,让用户在客户端通过浏览器软件提交查询词,然后很快返回一个可能和用户输入的查询内容相关的信息列表。这个列表通常会包括上万个条目,每个条目代表一篇查询到的相关网页。
然而,搜索引擎提供信息查询服务时,它面对的只是查询词,而有不同背景的用户可能提交相同的查询词,关心的却是和这个查询词相关的不同方面的信息,但搜索引擎通常是不知道用户背景的,因此搜索引擎所面临的主要问题就是既要争取不漏掉任何相关的信息,还要争取将那些“最可能被关心”的信息排在列表的前面。业界已经出现很多解决这方面问题的技术,常用的是通过评价网页的重要性来衡量该网页的相关程度。较知名的如页面排名(PageRank)、信任排名(TrustRank)、及反-信任排名(Reverse-TrustRank)等网页链接分析算法。然而,这些技术都只能在一定程度上提供与查询词尽可能相关的信息,以此供提出查询需求的用户做进一步的筛选,但却无法直接地返回用户想要的正确答案。
中国专利申请公开CN101093509A披露了一种交互查询系统,该系统在提供实时搜索结果的同时,还能够与互动问答平台进行交互。当用户在实时搜索引擎中搜寻不到其想要的结果时,可以通过互动问答平台发布问题。但系统只在用户界面上提供了互动问答平台上与该问题相关的链接,也就是说,用户如果想要得到符合自己搜索意图的问题的答案,还需要进一步手工点击链接,进入讨论页面与其他用户交流、讨论来获得答案。换言之,这种搜索引擎系统返回的结果仍然不是直接能够解决其疑问的答案。
发明内容
本发明的目的在于提供一种搜索引擎系统,其不仅能够返回给用户搜索结果列表,还能够与问答系统互动并返回与用户查询需求相关的问题的直接答案,从而提高了搜索的准确率,并且给用户提供了更为便利的查询服务。
本发明的目的还在于提供一种实现上述搜索引擎系统的方法。
为实现上述发明目的之一,本发明的一种搜索引擎系统,用于为用户提供搜索服务,并且还可与问答系统互动,该搜索引擎系统包括:
搜索引擎,用于接收包含有查询词的查询请求,根据所述查询请求执行搜索并获得搜索结果列表;
提问处理模块,用于将所述查询词生成提问请求;
问答通信模块,用于将所述提问请求发送给问答系统,并从问答系统获取与所述提问请求相关联的答案;
合成模块,用于将所述搜索结果列表和所述答案合成后返回给客户端;
所述提问处理模块还用于获取用户识别信息,判断用户在本次登录搜索引擎前的特定期间内是否有与该用户相关联的提问请求;
所述问答通信模块还用于在所述提问处理模块的判断结果为是时,从所述问答系统获取所述与该用户相关联的提问请求对应的新的答案,将所述新的答案提供给所述合成模块;
所述合成模块将所述新的答案返回给所述客户端。
作为本发明的进一步改进,所述提问处理模块的功能还包括:
用于判断所述查询词是词组还是自然语句,如果是自然语句,则生成包含所述自然语句的提问请求;如果是词组,则将词组转化为相关的自然语句,并生成包含转化后的自然语句的提问请求。
作为本发明的进一步改进,所述合成后的搜索结果列表和答案通过用户界面在客户端显示。
作为本发明的进一步改进,所述合成后的搜索结果列表和答案分别在所述用户界面的第一部分和第二部分显示,所述新的答案在所述用户界面的第三部分显示。
作为本发明的进一步改进,所述用户界面的第一部分静态显示搜索结果列表,所述用户界面的第二部分动态显示答案。
作为本发明的进一步改进,所述用户界面的第二部分包含有用于问题编辑的互动问答框。
作为本发明的进一步改进,所述用户界面还包括用于供客户端选择发起提问请求的提问按钮。
作为本发明的进一步改进,所述提问处理模块执行自然语句的转化包括以下功能:
当查询词为词组时,调用组句程序来生成包含有所述词组的若干自然语句的候选列表;
将所述候选列表通过用户界面在客户端显示,以供用户选择最接近其搜索意图的自然语句;
接收客户端的选择信息,并将被选择的自然语句确定为发起提问请求的自然语句。
作为本发明的进一步改进,所述提问处理模块还用于接收来自于客户端的问题编辑请求。
作为本发明的进一步改进,所述问题编辑请求包含有原问题信息,以及对原问题编辑的词组或自然语句。
作为本发明的进一步改进,所述问答通信模块通过定期轮询主动获取问答系统提供的答案。
作为本发明的进一步改进,所述问答通信模块通过开放应用编程接口被动接收问答系统推送过来的答案。
为实现上述另一目的,本发明的一种搜索引擎系统的实现方法,其包括:
接收包含有查询词的查询请求,根据所述查询请求执行搜索并获得搜索结果列表;
将所述查询词生成提问请求;
将所述提问请求发送给问答系统,并从问答系统获取与所述提问请求相关联的答案;
将所述搜索结果列表和所述答案合成后返回给客户端;
该方法还包括:
获取用户识别信息,判断用户在本次登录搜索引擎前的特定期间内是否有与该用户相关联的提问请求,如果是,从所述问答系统获取所述与该用户相关联的提问请求对应的新的答案,并将所述新的答案返回给所述客户端。
作为本发明的进一步改进,所述将查询词生成提问请求,包括以下步骤:
判断所述查询词是词组还是自然语句;
如果是自然语句,则生成包含所述自然语句的提问请求;
如果是词组,则将词组转化为相关的自然语句,并生成包含转化后的自然语句的提问请求。
作为本发明的进一步改进,所述合成后的搜索结果列表和答案通过用户界面在客户端显示。
作为本发明的进一步改进,所述合成后的搜索结果列表和答案分别在所述用户界面的第一部分和第二部分显示,所述新的答案在所述用户界面的第三部分显示。
作为本发明的进一步改进,所述答案根据接收时间的先后在用户界面的第二部分顺序排列。
作为本发明的进一步改进,所述答案在用户界面的第二部分滚动显示。
作为本发明的进一步改进,所述用户界面的第二部分可根据客户端的控制请求实现缩放。
作为本发明的进一步改进,该方法在将所述搜索结果列表和所述答案合成后返回给客户端的步骤后还包括
接收来自于客户端的与所述提问请求相关联的问题编辑请求;
将所述问题编辑请求推送给问答系统;并
从问答系统获取与所述问题编辑请求相关联的答案。
作为本发明的进一步改进,所述搜索引擎系统向问答系统发出的提问请求根据来自于客户端的请求而发起。
作为本发明的进一步改进,将词组转化为相关的自然语句的步骤包括
当查询词为词组时,调用组句程序来生成包含有所述词组的若干自然语句的候选列表;
将所述候选列表通过用户界面在客户端显示,以供用户选择最接近其搜索意图的自然语句;
接收客户端的选择信息,并将被选择的自然语句确定为发起提问请求的自然语句。
作为本发明的进一步改进,从问答系统获取答案的步骤包括通过定期轮询主动获取问答系统提供的答案。
作为本发明的进一步改进,从问答系统获取答案的步骤包括通过开放应用编程接口(API)被动接收问答系统推送过来的答案。
作为本发明的进一步改进,所述用户识别信息是搜索引擎系统在客户端初次访问系统时分配并发送给客户端的唯一标识信息;所述获取用户识别信息的步骤包括从客户端读取该唯一标识信息。
与现有技术相比,本发明的有益效果是:搜索引擎系统不仅可以提供常规的查询服务,而且可以发掘用户潜在的问题需求,通过与问答系统的互动,获取其他用户对该问题需求的答案,并将答案和搜索结果列表合成后一起显示给用户,使得用户不需要访问问答互动平台,仅通过搜索引擎系统的用户界面就可以同时获取搜索结果和其他用户提供的答案,从而一方面提高了搜索的准确率,使用户获得了最想要的信息,另一方面,给用户的使用带来了很大的便利。此外,用户还可以在搜索引擎系统的用户界面对问题进行补充和修改,实现与问答互动平台的互动,从而进一步提高了用户使用的便利性。
附图说明
图1是本发明一具体实施方式中搜索引擎系统和问答系统互动的工作原理框图;
图2是图1所示的搜索引擎系统执行搜索功能的工作原理框图;
图3是本发明的搜索引擎系统的用户界面的第一实施方式的示意图;
图4是本发明的搜索引擎系统的用户界面的第二实施方式的示意图;
图5是本发明的搜索引擎系统的用户界面的第三实施方式的示意图;
图6是本发明的搜索引擎系统实现方法的工作流程图;
图7是与本发明的搜索引擎系统互动的问答系统的工作流程图;
图8是本发明的搜索引擎系统处理问题编辑请求的工作流程图;
图9是与本发明的搜索引擎系统互动的问答系统处理问题编辑请求的工作流程图;
图10是本发明的搜索引擎系统提供用户历史问题记录的工作流程图。
具体实施方式
以下将结合附图所示的各实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所轻易做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
图1所示的本发明的搜索引擎系统10通过网络与问答系统20以及客户端实现互动的工作原理框图。本实施方式中,搜索引擎系统10不仅能够提供常规的搜索服务,还能够与问答系统20实现互动,将与搜索请求相关的问题发布在问答系统20的问答互动平台上,并获取答案以展现给提出搜索请求的用户。其中,搜索引擎系统10或问答系统20可以包括一个或多个用来存储和管理网页、并响应客户端的网页浏览器请求的网络服务器实体。客户端30、40可以包括一个或多个用户终端设备,如个人计算机、笔记本电脑、无线电话、个人数字处理(PDA)、或其它计算机装置和通信装置。
这些服务器和终端设备在架构上都包含一些基本组件,如总线、处理装置、存储装置、一个或多个输入/输出装置、和通信接口等。总线可以包括一个或多个导线,用来实现服务器或终端设备各组件之间的通信。处理装置包括各类型的用来执行指令、处理进程或线程的处理器或微处理器。存储装置可以包括存储动态信息的随机访问存储器(RAM)等动态存储器,和存储静态信息的只读存储器(ROM)等静态存储器,以及包括磁或光学记录介质与相应驱动的大容量存储器。输入装置供用户输入信息到服务器或终端设备,如键盘、鼠标、手写笔、声音识别装置、或生物测定装置等。输出装置包括用来输出信息的显示器、打印机、扬声器等。通信接口用来使服务器或终端设备与其它系统或装置进行通信。通信接口之间可通过有线连接、无线连接、或光连接连接到网络中,使搜索引擎系统10、问答系统20、客户端30、40间能够通过网络实现相互间的通信。网络可以包括局域网(LAN)、广域网(WAN)、电话网络如公共交换电话网(PSTN)、企业内部的互联网、因特网、或上述这些网络的结合等。
服务器和终端设备上均包含有用来管理系统资源、控制其它程序运行的操作系统软件,以及用来实现特定功能模块的应用软件。如图1所示,本实施方式中,搜索引擎系统10包括搜索引擎11、提问处理模块12、问答通信模块13、合成模块14、用户界面15。配合参照图2所示,图2从概念上演示了搜索引擎系统10执行搜索功能的功能组件框图。搜索引擎系统10整体上可分为离线部分和在线部分。在离线部分,系统会事先搜集一批网页,并以某种方式存放在系统中,系统包括网页抓取器18、分类器17、和被分类网页的数据库16。
网页抓取器19是根据一定的策略通过网页之间的超链接关系来一个个抓取网页的程序。具体的,网页抓取器18从初始的统一资源定位符(以下简称URL)库中获得输入,解析URL中标明的网络服务器地址,然后建立连接、发送请求、和接收数据,将获得的网页数据储存到本地服务器并建立本地文档集合,然后从其中提取链接以进行下一步的抓取动作,如此循环往复直到所有的URL抓取完为止。网页抓取器19所依据的抓取策略包括广度优先策略和深度优先策略。分类器17用于对本地文档集合进行分析并建立索引。例如通过分词从文档的全文中抽取词条,然后过滤除去高频词或低频词,以及对词条进行同义词转换以获得索引词集合,最后将网页到索引词的映射转化为索引词到网页的映射,形成包含索引词表和倒排表的倒排文件并存储在被分类网页数据库16中。
搜索引擎系统10的在线部分主要包括搜索引擎11。搜索引擎11响应客户端30的搜索请求,将文档集合返回给客户端30。文档集合表现为包含链接的搜索结果列表,其链接到与查询词相关的网页上。网页通常包括文本信息,也可以包括嵌入信息(如元数据、图像、超连接等)和/或嵌入指令(如Javascript等)。搜索引擎11包括搜索组件111和排列组件112。搜索组件111可以接收用户的查询请求,该查询请求中包含有查询词。搜索组件111生成查询词表,然后与被分类网页数据库16中的索引词表进行匹配,找到相应的索引词以及每个索引词对应的倒排表,从而获得与查询词相关的文档集合。排列组件112根据一定的网页链接分析算法得出每个文档与查询词之间的相关度,再将相关度大于预定阈值的文档筛选出来并根据相关程度顺序排列,然后将列表返回给客户端。其中网页链接分析算法可以包括页面排名(PageRank)、信任排名(TrustRank)、及反-信任排名(Reverse-TrustRank)等算法。
本实施方式中,搜索引擎系统10不仅能够实现常规的搜索引擎功能,还能将用户的查询需求转换为相关的提问,然后发送给问答系统20以在问答互动平台上发布,并获取答案后返回给用户。该功能可以由系统自行处理,也可以通过用户发起而处理。搜索引擎系统10的提问处理模块12接收来自客户端30的包含有查询词的查询请求。查询词可能是一个或多个词组,也有可能是自然语句。如果是查询词自然语句,则生成包含该自然语句的提问请求,并通过问答通信模块13发送给问答系统20;如果查询词为词组,则提问处理模块12执行组句程序以获得与查询词相关的自然语句,然后将包含该自然语句的提问请求通过问答通信模块13发送给问答系统20。问答通信模块13还用于从问答系统获取与提问请求相关的答案数据,并将答案数据传递给合成模块14。关于提问处理模块的自然语句转化处理,以及问答通信模块13获取答案的方式,均会在后文作详细描述。合成模块14还会接收来自搜索引擎11的搜索结果列表的输入,然后将搜索结果列表和答案根据预定的显示模式合成,而后在用户界面15上显示出来。关于用户界面15的显示,后文将会作详细描述。
问答系统20可以为用户提供一个问答互动的平台。用户可以在该平台上发布自己无法解决的问题,知道答案的其他用户可以在该平台的问题页面下提供答案。通常,为了鼓励用户的参与,提供最佳答案的用户还可以获得积分。目前较为常见的问答互动平台如“百度知道”、“雅虎知识堂”、“新浪知识人”等。本实施方式中,问答系统20可以包括用来处理提问和答复的问答处理模块21、存储问题和答案信息的问题数据库22、以及用户界面23。后文将会对问答系统的工作流程做详细描述。
客户端30代表向搜索引擎系统10提出查询请求的一个或多个终端设备,而客户端40代表向问答系统提供问题答案的一个或多个终端设备。在本实施方式中,客户端30、40均包括浏览器软件31、41。浏览器软件可以包括网页浏览器,如微软的英特网浏览器(Internet Explorer),或者网景的导航浏览器(NetscapeNavigator)。通过浏览器软件,客户端可以访问相应的网络服务器,定位网页。本实施方式中,搜索引擎系统10的用户界面15可以通过浏览器软件31显示给提出查询请求的用户,而问答系统的用户界面23可以通过浏览器软件41显示给提供问题答案的用户。
图3至图5显示的是本发明的搜索引擎系统10的用户界面15的三种实施方式。在图3显示的第一实施方式中,用户界面15的上部显示查询输入框151和查询确认按钮152。在有的实施方式中,搜索引擎系统10的问答互动功能是由用户发起的,所以在这些实施方式中,用户界面15的上部还会显示用于发起提问的提问按钮153。该提问按钮153可以单独用于发起提问功能;也可以同时发起提问和搜索的功能,在这种情况下,用户在查询框151输入查询词后,只需点击按钮153,搜索引擎系统10就能执行常规的搜索功能,同时又会向问答系统20发起提问。在第一实施方式中,用户界面15的下部包括用于显示搜索结果列表的第一部分154和用于显示问题答案的第二部分155。由于针对一次查询所得到的搜索结果列表是确定的、并且不会再有变化,所以搜索结果列表在第一部分154可以静态地显示。但对于在问答互动平台上发布的同一个问题,有可能有多个用户参与回答,而且回答的时间也不同,所以用户界面15的第二部分155可以动态的显示这些答案。例如,搜索引擎系统10根据各答案的接收时间的先后顺序,在第二部分将多个答案从上至下排列出,并且当答案列表长度超出第二部分显示区域时,处于顶部的答案则被挤出第二部分。在其他实施方式中,第二部分155也可以设置成滚动显示条,即将多个答案不停的滚动显示,使用户还是有机会能够浏览到所有的答案;此外,第二部分也可以是可缩放的,用户可根据自己的需要来展开或缩放第二部分显示区域;另外,第二部分还可以位于第一部分的上方。图4所示的用户界面15的第二实施方式与第一实施方式的主要区别在于,第二部分155的显示区域内还包含有供用户补充或修改问题的互动问答框156;图5所示的用户界面15的第三实施方式与第二实施方式的主要区别在于,用户界面15还包括一第三部分157的显示区域,在该部分能够显示该用户在之前提出过的问题以及针对该问题尚未显示过的答案。在其它实施方式中,第三部分157也可以包含在第二部分156的区域内,或者第二和第三两部分完全重叠。关于第二实施方式中的问题编辑和第三实施方式中的历史问题记录显示,后文将会作进一步地阐述。
以下结合图6至图10对本发明的搜索引擎系统的实现方法做详细说明。图6主要想表现的是,在与问答系统20的互动过程中,本发明的搜索引擎系统10的工作流程。用户在客户端30通过浏览器31显示搜索引擎系统的用户界面15,并在查询输入框151中输入查询词,搜索引擎系统10就会接收到包含有查询词的查询请求(步骤611)。随后,搜索引擎11就会执行搜索程序(步骤612),并将搜索结果列表输出给合成模块14。由于用户输入的查询词可能是词组,也有可能是自然语句,而只有自然语句才适合在问答互动平台上提出,所以提问处理模块12在接收到查询请求后,首先会判断查询词是否是自然语句(步骤613)。如果是自然语句,则提问处理模块12生成包含该自然语句的提问请求,并通过问答通信模块13发送给问答系统20(步骤615);反之,如果查询词为词组,则提问处理模块12执行组句程序以获得包含有查询词组的自然语句(步骤614),然后生成包含转化后的自然语句的提问请求,并通过问答通信模块13发送给问答系统20(步骤615)。
比如,在一次检索中,用户输入了三个词组“诺基亚”、“N97”、“价格”,提问处理模块12根据自然语句的识别程序得出这一组查询词不具有完整的语法结构,所以判断其为词组;然后提问处理模块12调用组句程序将这组关键词进行组句,如三个词组组成的自然语句为“诺基亚N97的价格是多少”,随后生成包含该自然语句的提问请求。当然,在其他实施方式中,执行组句程序后可能出现多个自然语句,提问处理模块12无法确定哪个是最符合用户搜索意图的,则会生成包含这几个可能的自然语句的候选列表,并通过用户界面15显示给用户,然后根据用户最终选择的自然语句发出提问请求。还是以上述三个关键词组为例,自然语句除了是“诺基亚N97的价格是多少”外,还可能是“诺基亚N97的价格高吗”,“诺基亚N97的价格降了吗”等。提问处理模块12将这些问题排列成列表,并且每个问题前都附有一个单选框,用户只要点选了某个的单选框,相应的自然语句就会被确定为发出提问请求的问题。
问答通信模块13会获取问答系统20返回的相应问题的答案(步骤616)。问答通信模块13可以通过定期轮询的方法来获取答案,例如,问答通信模块13每隔一段时间向问答系统20发送包含之前提问信息的答案获取请求,响应该请求,问答系统20的问答处理模块21会从问题数据库22中得到对于相应问题的答案数据,并返回给问答通信模块13;问答通信模块13将此次的答案数据与上一次的答案数据比较,以确定是否的新的答案;一旦获得有新的答案,问答通信模块13就会将该新的答案数据输出给合成模块14。问答通信模块13也可以通过开放应用编程接口(API)获取答案,当有用户在问答互动平台上提交了新的答案后,问答系统20就可以将该答案数据即时推送给问答通信模块13,从而确保搜索引擎系统10能够将答案实时显示给提出查询请求的用户。合成模块14在接收到搜索结果列表和答案数据后,会根据预定的显示模式合成用户界面15(步骤617),如图3至图5所讨论的;而在客户端30,会通过浏览器31显示该用户界面15。
图7所示的是与本发明的搜索引擎系统互动的问答系统的工作流程。问答系统20的问答处理模块21在接收到问答通信模块13发送过来的提问请求(步骤621)后,通过预定的规则进行审核后(如合法性的审核)就可以直接在问答互动平台上发布问题。但有可能存在着相同或类似的问题之前已经提出过,为使资源能够有效利用,作为优选的实施方式,问答处理模块21可以先判断是否已有相同或相似的问题已经提出过(步骤622),即搜索问题数据库22中是否储存有相同或类似问题。比如,问答处理模块21可以将接收到的自然语句通过“切词”转换成包含若干词组一个词的序列,然后将这个词的序列与问题数据库22中的问题进行匹配,当匹配度大于一特定阈值时,表明存在相同或相似问题,随后,问答处理模块21获取该问题的答案(步骤623),并将该问题的答案数据返回给搜索引擎系统10(步骤626),如前所述,可以是主动返回,也可以响应问答通信模块13的请求而返回。如果判断没有相同或类似的问题,问答处理模块21将该问题发布到问答互动平台上,其他用户通过客户端40的浏览器41所显示的问答系统的用户界面23来提供答案。问答处理模块21获取到这些答案后会将其存储到问题数据库22中,并将答案返回给搜索引擎系统10(步骤626)。
图8所示的是搜索引擎系统10在接收到用户的问题编辑请求后的工作流程。用户通过用户界面15得到答案后,有可能想了解进一步的信息,或者觉得之前的问题不清楚,如此,用户可以通过互动问答框156对原问题进行编辑,如对原问题的补充或修改。还是以上述的问题为例,用户在获得“诺基亚N97的价格是多少”的初步答案后,其想了解诺基亚N97在北京地区的价格,则其可以在互动问答框156中输入自然语句“诺基亚N97在北京地区的价格是多少”。当然,用户也可以直接输入词组“北京”,此时,与对查询输入框151的处理类似,提问处理模块12执行组句程序而得到相应的自然语句。接下来,提问处理模块12会生成问题编辑请求,并通过问答通信模块13向问答系统20发送(步骤632),该问题编辑请求中不仅包含编辑后的自然语句,还包含有原问题的信息。然后,问答通信模块13会从问答系统20获取更新后的答案(步骤633),并传递给合成模块14,随后合成模块14将新的答案数据与之前的搜索结果列表和答案数据结合后按照预定的显示模式通过用户界面15显示出来(步骤634)。
图9所示的是与搜索引擎系统互动的问答系统处理问题编辑请求的工作流程。问答处理模块21在接收到问题编辑请求后(步骤641),根据请求中的原问题信息在问题数据库22中找到原提问数据,再在原提问数据中加入编辑信息并发布(步骤642)。即问答处理模块21并没有针对编辑后的问题建立新的网页,而是在与该问题编辑相关的原问题的网页中发布编辑后的自然语句问题。由于之前提供过答案的用户往往会比较关注原问题的网页,可能经常登录该网页来查看问题的进展,关注是否有比其提供的答案更好的其他的答案,所以他/她发现了问题的补充信息后,会提供进一步的答案。显然,这比建立新的问题网页能够更快地得到答案。与上述实施方式类似,问答处理模块21在获得新的答案后(步骤643),新的答案数据会储存到问题数据库22中,同时问答处理模块21将新的答案返回给搜索引擎系统10(步骤644)。
图10所示的是搜索引擎系统提供给用户历史问题记录的工作流程。通常,用户一次检索的时间可能不会持续很长,也就是说,这段时间内,在问答互动平台上发布的相关问题,可能还没有获得足够多的有效答案。如此,当用户开始新的搜索,或者当用户再次登录搜索引擎系统10时,系统会在用户界面15的第三部分157显示该用户在之前提出过的问题以及针对该问题尚未显示过的答案。具体工作流程如下:当用户开始新的搜索或者再次登录搜索引擎系统时,提问处理模块12会获取该用户的识别信息(步骤651),然后判断该用户之前是否发起过提问请求(步骤652)。由于用户可能不会对很久之前的问题感兴趣,所以作为优选的实施方式,提问处理模块12可以预先设定一个判断的期间,即在该用户此次登录前的特定期间内,是否发起过提问请求。本领域技术人员所熟知的是,如果此前用户通过客户端30访问过搜索引擎系统10的服务器,服务器端会分配给该用户一个唯一的标识,并由服务器发送该标识信息(如cookie)给客户端的浏览器31并由其保存。当该用户再次访问该服务器时,服务器就能够从浏览器31读取该标识信息,从而识别该用户。本实施方式中,当提问处理模块12未查到该用户的识别信息,或虽然该用户可识别,但其之前未发起过提问,则系统退出当前程序(步骤653),即返回主程序。如果该用户之前有过提问,则问答通信模块13向问答系统20发送请求以获取对于相应问题的答案。当问答通行模块13获取到答案后,会判断自从该用户上次登录后,是否有新的答案。若没有,则系统退出当前程序(步骤653);如果有新的答案,则将新的答案数据及相应的问题传递给合成模块14,合成模块14通过用户界面15的第三部分157来显示问题及对于该问题的新的答案(步骤655)。
本发明的搜索引擎系统不仅可以提供常规的查询服务,而且可以发掘用户潜在的问题需求,通过与问答系统的互动,获取其他用户对该问题需求的答案,并将答案和搜索结果列表合成后一起显示给用户,使得用户不需要访问问答互动平台,仅通过搜索引擎系统的用户界面就可以同时获取搜索结果和其他用户提供的答案,从而一方面提高了搜索的准确率,使用户获得了最想要的信息,另一方面,给用户的使用带来了很大的便利。此外,用户还可以在搜索引擎系统的用户界面对问题进行补充和修改,实现与问答互动平台的互动,从而进一步提高了用户使用的便利性。
应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims (25)

1.一种搜索引擎系统,其特征在于,搜索引擎系统包括:
搜索引擎,用于接收包含有查询词的查询请求,根据所述查询请求执行搜索并获得搜索结果列表;
提问处理模块,用于将所述查询词生成提问请求;
问答通信模块,用于将所述提问请求发送给问答系统,并从问答系统获取与所述提问请求相关联的答案;
合成模块,用于将所述搜索结果列表和所述答案合成后返回给客户端;
所述提问处理模块还用于获取用户识别信息,判断用户在本次登录搜索引擎前的特定期间内是否有与该用户相关联的提问请求;
所述问答通信模块还用于在所述提问处理模块的判断结果为是时,从所述问答系统获取所述与该用户相关联的提问请求对应的新的答案,将所述新的答案提供给所述合成模块;
所述合成模块将所述新的答案返回给所述客户端。
2.根据权利要求1所述的搜索引擎系统,其特征在于,所述提问处理模块的功能还包括:
用于判断所述查询词是词组还是自然语句,如果是自然语句,则生成包含所述自然语句的提问请求;如果是词组,则将词组转化为相关的自然语句,并生成包含转化后的自然语句的提问请求。
3.根据权利要求1所述的搜索引擎系统,其特征在于,所述合成后的搜索结果列表和答案通过用户界面在客户端显示。
4.根据权利要求3所述的搜索引擎系统,其特征在于,所述合成后的搜索结果列表和答案分别在所述用户界面的第一部分和第二部分显示,所述新的答案在所述用户界面的第三部分显示。
5.根据权利要求4所述的搜索引擎系统,其特征在于,所述用户界面的第一部分静态显示搜索结果列表,所述用户界面的第二部分动态显示答案。
6.根据权利要求4所述的搜索引擎系统,其特征在于,所述用户界面的第二部分包含有用于问题编辑的互动问答框。
7.根据权利要求3所述的搜索引擎系统,其特征在于,所述用户界面还包括用于供客户端选择发起提问请求的提问按钮。
8.根据权利要求1所述的搜索引擎系统,其特征在于,所述提问处理模块执行自然语句的转化包括以下功能:
当查询词为词组时,调用组句程序来生成包含有所述词组的若干自然语句的候选列表;
将所述候选列表通过用户界面在客户端显示,以供用户选择最接近其搜索意图的自然语句;
接收客户端的选择信息,并将被选择的自然语句确定为发起提问请求的自然语句。
9.根据权利要求1所述的搜索引擎系统,其特征在于,所述提问处理模块还用于接收来自于客户端的问题编辑请求。
10.根据权利要求9所述的搜索引擎系统,其特征在于,所述问题编辑请求包含有原问题信息,以及对原问题编辑的词组或自然语句。
11.根据权利要求1所述的搜索引擎系统,其特征在于,所述问答通信模块通过定期轮询主动获取问答系统提供的答案。
12.根据权利要求1所述的搜索引擎系统,其特征在于,所述问答通信模块通过开放应用编程接口被动接收问答系统推送过来的答案。
13.一种搜索引擎系统的实现方法,其特征在于,该方法包括:
接收包含有查询词的查询请求,根据所述查询请求执行搜索并获得搜索结果列表;
将所述查询词生成提问请求;
将所述提问请求发送给问答系统,并从问答系统获取与所述提问请求相关联的答案;
将所述搜索结果列表和所述答案合成后返回给客户端;
该方法还包括:
获取用户识别信息,判断用户在本次登录搜索引擎前的特定期间内是否有与该用户相关联的提问请求,如果是,从所述问答系统获取所述与该用户相关联的提问请求对应的新的答案,并将所述新的答案返回给所述客户端。
14.根据权利要求13所述的方法,其特征在于,所述将查询词生成提问请求,包括以下步骤:
判断所述查询词是词组还是自然语句;
如果是自然语句,则生成包含所述自然语句的提问请求;
如果是词组,则将词组转化为相关的自然语句,并生成包含转化后的自然语句的提问请求。
15.根据权利要求13所述的方法,其特征在于,所述合成后的搜索结果列表和答案通过用户界面在客户端显示。
16.根据权利要求15所述的方法,其特征在于,所述合成后的搜索结果列表和答案分别在所述用户界面的第一部分和第二部分显示,所述新的答案在所述用户界面的第三部分显示。
17.根据权利要求16所述的方法,其特征在于,所述答案根据接收时间的先后在用户界面的第二部分顺序排列。
18.根据权利要求16所述的方法,其特征在于,所述答案在用户界面的第二部分滚动显示。
19.根据权利要求16所述的方法,其特征在于,所述用户界面的第二部分可根据客户端的控制请求实现缩放。
20.根据权利要求13所述的方法,其特征在于,该方法在将所述搜索结果列表和所述答案合成后返回给客户端的步骤后还包括
接收来自于客户端的与所述提问请求相关联的问题编辑请求;
将所述问题编辑请求推送给问答系统;并
从问答系统获取与所述问题编辑请求相关联的答案。
21.根据权利要求13所述的方法,其特征在于,所述搜索引擎系统向问答系统发出的提问请求根据来自于客户端的请求而发起。
22.根据权利要求14所述的方法,其特征在于,将词组转化为相关的自然语句的步骤包括
当查询词为词组时,调用组句程序来生成包含有所述词组的若干自然语句的候选列表;
将所述候选列表通过用户界面在客户端显示,以供用户选择最接近其搜索意图的自然语句;
接收客户端的选择信息,并将被选择的自然语句确定为发起提问请求的自然语句。
23.根据权利要求13所述的方法,其特征在于,从问答系统获取答案的步骤包括通过定期轮询主动获取问答系统提供的答案。
24.根据权利要求13所述的方法,其特征在于,从问答系统获取答案的步骤包括通过开放应用编程接口API被动接收问答系统推送过来的答案。
25.根据权利要求13所述的方法,其特征在于,所述用户识别信息是搜索引擎系统在客户端初次访问系统时分配并发送给客户端的唯一标识信息;所述获取用户识别信息的步骤包括从客户端读取该唯一标识信息。
CN 201010592251 2010-12-09 2010-12-09 搜索引擎系统及其实现方法 Active CN102004794B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010592251 CN102004794B (zh) 2010-12-09 2010-12-09 搜索引擎系统及其实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010592251 CN102004794B (zh) 2010-12-09 2010-12-09 搜索引擎系统及其实现方法

Publications (2)

Publication Number Publication Date
CN102004794A CN102004794A (zh) 2011-04-06
CN102004794B true CN102004794B (zh) 2013-05-08

Family

ID=43812156

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010592251 Active CN102004794B (zh) 2010-12-09 2010-12-09 搜索引擎系统及其实现方法

Country Status (1)

Country Link
CN (1) CN102004794B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177025B (zh) * 2011-12-23 2017-07-21 深圳市世纪光速信息技术有限公司 一种互动问答信息系统回答信息的推荐方法和装置
CN103067387B (zh) * 2012-12-27 2016-01-27 中国建设银行股份有限公司 一种反钓鱼监测系统和方法
CN103235787A (zh) * 2013-03-28 2013-08-07 北京百度网讯科技有限公司 一种用于提供关于目标对象的目标信息的方法与设备
CN103714174B (zh) * 2014-01-02 2017-01-11 武汉大学 用于互联网中加速经验知识积累的信息采集方法及系统
US20150278370A1 (en) * 2014-04-01 2015-10-01 Microsoft Corporation Task completion for natural language input
CN104331440A (zh) * 2014-10-24 2015-02-04 北京奇虎科技有限公司 基于搜索引擎提供查询结果的即时通讯方法和客户端
CN104376046A (zh) * 2014-10-24 2015-02-25 北京奇虎科技有限公司 基于搜索引擎提供查询结果的浏览方法和浏览器客户端
CN104331441A (zh) * 2014-10-24 2015-02-04 北京奇虎科技有限公司 基于搜索引擎提供问题答案的方法和装置
CN105786870B (zh) * 2014-12-23 2019-06-25 北京奇虎科技有限公司 基于搜索的问题发布方法和装置
CN105786872A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于用户搜索提供问答onebox的方法和装置
CN104866522A (zh) * 2015-03-25 2015-08-26 百度在线网络技术(北京)有限公司 一种为提问者提供回答信息的方法与装置
CN106407198A (zh) * 2015-07-28 2017-02-15 百度在线网络技术(北京)有限公司 问答信息的处理方法及装置
CN106469358B (zh) * 2015-08-20 2020-10-09 菜鸟智能物流控股有限公司 物流信息处理方法及装置
CN105630937A (zh) * 2015-12-22 2016-06-01 北京奇虎科技有限公司 一种搜索试题答案的方法以及装置
CN107436900B (zh) * 2016-05-26 2022-08-09 北京搜狗科技发展有限公司 基于搜索引擎的信息处理方法和装置
CN106168962B (zh) * 2016-06-30 2020-02-21 北京奇虎科技有限公司 基于自然搜索结果提供精确观点的搜索方法及装置
CN107992554A (zh) * 2017-11-28 2018-05-04 北京百度网讯科技有限公司 提供问答信息的聚合结果的搜索方法和装置
CN110580313B (zh) * 2018-06-08 2024-02-02 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
CN109684443B (zh) * 2018-11-01 2020-11-24 百度在线网络技术(北京)有限公司 智能交互方法和装置
CN111581487B (zh) * 2020-05-11 2023-05-05 北京字节跳动网络技术有限公司 一种信息处理方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093509A (zh) * 2007-07-18 2007-12-26 中国科学院计算技术研究所 一种查询交互系统和方法
CN101118554A (zh) * 2007-09-14 2008-02-06 中兴通讯股份有限公司 智能交互式问答系统及其处理方法
CN101405734A (zh) * 2006-01-23 2009-04-08 查查搜索公司 用于人工辅助挖掘和捕获精确结果的自动工具
CN101593206A (zh) * 2009-06-25 2009-12-02 腾讯科技(深圳)有限公司 基于问答互动平台中答案的搜索方法及装置
WO2009158636A2 (en) * 2008-06-27 2009-12-30 Google Inc. Presenting references with answers in forums
CN101882291A (zh) * 2010-08-10 2010-11-10 万昌洵 一种基于搜索引擎技术的提问式商品信息咨询方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100565516C (zh) * 2006-12-08 2009-12-02 腾讯科技(深圳)有限公司 一种移动终端进行网络搜索的方法及系统
KR20110134909A (ko) * 2009-03-13 2011-12-15 인벤션 머신 코포레이션 텍스트 문서들 및 사용자 질문들의 의미적 라벨링에 기초한 질문-응답 시스템 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101405734A (zh) * 2006-01-23 2009-04-08 查查搜索公司 用于人工辅助挖掘和捕获精确结果的自动工具
CN101093509A (zh) * 2007-07-18 2007-12-26 中国科学院计算技术研究所 一种查询交互系统和方法
CN101118554A (zh) * 2007-09-14 2008-02-06 中兴通讯股份有限公司 智能交互式问答系统及其处理方法
WO2009158636A2 (en) * 2008-06-27 2009-12-30 Google Inc. Presenting references with answers in forums
CN101593206A (zh) * 2009-06-25 2009-12-02 腾讯科技(深圳)有限公司 基于问答互动平台中答案的搜索方法及装置
CN101882291A (zh) * 2010-08-10 2010-11-10 万昌洵 一种基于搜索引擎技术的提问式商品信息咨询方法

Also Published As

Publication number Publication date
CN102004794A (zh) 2011-04-06

Similar Documents

Publication Publication Date Title
CN102004794B (zh) 搜索引擎系统及其实现方法
CN102073725B (zh) 结构化数据的搜索方法和实现该搜索方法的搜索引擎系统
US9348872B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
CN102073726B (zh) 搜索引擎系统的结构化数据的引入方法和装置
US6701310B1 (en) Information search device and information search method using topic-centric query routing
US8775396B2 (en) Method and system for searching a wide area network
JP5133984B2 (ja) 入力候補提供装置、入力候補提供システム、入力候補提供方法、および入力候補提供プログラム
US7725526B1 (en) System and method for web based sharing of search engine queries
US8849855B2 (en) Context-directed search
US7930287B2 (en) Systems and methods for compound searching
JP2001510607A (ja) 増殖概念による索引付け手法を用いたインテリジェントネットワークブラウザ
CN104699782A (zh) 分散型的web注释
JP5514486B2 (ja) Webページの関連性抽出方法、装置、及びプログラム
CN112632359A (zh) 信息推荐方法、装置、电子设备和存储介质
US7668859B2 (en) Method and system for enhanced web searching
US20120066256A1 (en) Method and system for generating search urls
CN103177025A (zh) 一种互动问答信息系统回答信息的推荐方法和装置
US20060074843A1 (en) World wide web directory for providing live links
US11194883B2 (en) Alert driven interactive interface to a website mining system
JP2010176298A (ja) ファセットクエリを利用したサービス誘導入札装置及び方法
KR20010097062A (ko) 자동 링크 지원 시스템
CN1922606B (zh) 用于面向用户的互联网导航的动态关键字处理系统和方法
JP5138576B2 (ja) ファセットクエリを利用した検索ナビゲーション装置及び方法
JP2005209020A (ja) 属性情報提供システム,属性情報管理装置,利用者端末,属性情報管理方法,およびコンピュータプログラム
Hoe‐Lian Goh et al. Collaborative querying using the query graph visualizer

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant