【发明内容】
基于此,有必要提供一种可针对搜索结果实时反馈的调整引擎策略,以得到准确搜索结果的方法。
此外,还有必要提供一种可针对搜索结果实时反馈的调整引擎策略,以得到准确搜索结果的系统。
一种网页搜索方法,包括如下步骤:获取用户反馈信息;以及根据所述用户反馈信息调整搜索引擎策略,根据所述调整后的新搜索引擎策略进行网页搜索。
优选地,所述获取用户反馈信息的步骤之前还包括:提供并设置与缺陷编码一一对应的反馈信息控件的步骤;
优选地,所述获取用户反馈信息的步骤具体是:通过所述反馈信息控件的选择,获取缺陷编码,并采集关键词修改信息,以得到记录了所述缺陷编码和关键词修改信息的用户反馈信息;构建会话,将所述用户反馈信息打包生成会话数据包并发送。
优选地,所述发送会话数据包的步骤之前还包括:加密所述会话数据包的步骤。
优选地,所述根据用户反馈信息调整搜索引擎策略的步骤具体是:接收所述会话数据包;解析所述会话数据包获取用户反馈信息,并根据所述用户反馈信息中的关键词修改信息计算原关键词与新关键词的重合度;解析所述缺陷编码,获取用户的反馈信息;根据所述用户反馈信息和原搜索引擎策略,调整搜索引擎策略。
优选地,所述接收会话数据包的步骤之后还包括解密所述会话数据包的步骤,所述根据所述用户反馈信息和原搜索引擎策略,调整搜索引擎策略的步骤之后还包括加密所述调整后的搜索引擎策略的步骤。
优选地,所述根据关键词修改信息计算原关键词与新关键词的重合度的步骤具体是:计算原关键词与新关键词的重合度,如果计算得到的重合度小于重合度阈值,则清空会话信息,并新建会话。
一种网页搜索系统,所述系统包括:浏览器,用于获取用户反馈信息;搜索引擎服务器,用于根据用户反馈信息调整搜索引擎策略,根据所述调整后的新搜索引擎策略进行网页搜索。
优选地,所述浏览器包括提供并设置反馈信息控件的输入模块,所述反馈信息控件与缺陷编码一一对应。
优选地,所述浏览器还包括:反馈采集模块,用于通过所述反馈信息控件的选择获取缺陷编码,并采集关键词修改信息,以得到记录了所述缺陷编码和关键词修改信息的用户反馈信息;会话构建模块,用于构建会话,将所述用户反馈信息打包生成会话数据包。第一通信模块,用于发送所述会话数据包至所述搜索引擎服务器。
优选地,所述第一通信模块还包括:第一加解密模块,用于加密所述会话数据包。
优选地,所述搜索引擎服务器包括:第二通信模块,用于接收所述会话数据包并返回所述新搜索引擎策略及搜索结果至所述浏览器;会话处理模块,用于解析所述会话数据包获取用户反馈信息,并根据用户反馈信息中的关键词修改信息计算原关键词与新关键词的重合度;解析模块,解析所述缺陷编码,获取用户的反馈信息;策略调整模块,根据所述用户反馈信息和原搜索引擎策略,调整搜索引擎策略。
优选地,所述第二通信模块之后还包括:第二加解密模块,用于在接收所述会话数据包之后解密所述会话数据包以及在根据所述用户反馈信息和原搜索引擎策略,调整搜索引擎策略之后加密所述调整后的搜索引擎策略。
优选地,所述会话处理模块计算原关键词与新关键词的重合度,如果计算得到的重合度小于重合度阈值,则清空会话信息,并新建会话。
上述网页搜索方法及系统的方法及系统通过浏览器窗口实时获取用户针对搜索结果选择的反馈信息控件和对关键词的修改信息以得到反馈信息,并根据反馈信息分析理解从而调整搜索引擎策略,重新选择网页生成搜索结果,从而使得用户可在搜索的同时针对搜索结果提出实时意见,以得到理想的搜索结果。
另外,在搜索引擎中引入了会话的过程,使用户的调整关键词、翻页等动作对搜索引擎而言成为一次次相互联系的行为,实现了用户与搜索引擎间的交互,优化了搜索引擎策略,能让用户及时获取搜索结果,满足了用户需求。
【具体实施方式】
图1示出了一个实施例中网页搜索的方法流程,具体过程如下:
在步骤S10中,获取用户反馈信息。一实施方式中,在获取用户反馈信息之前包括了提供并设置与缺陷编码一一对应的反馈信息控件的步骤。一实施例中,如图3所示,通过在网页中设置反馈信息控件,每一反馈信息控件表示一个搜索结果中的缺陷因子,并相对应一个缺陷编码,例如该缺陷因子可以包括时间太旧、内容不相关、结果单一、重复较多、没有视频等。用户通过在浏览器对多个反馈信息控件的选择,即对搜索结果中的哪一方面不满意,则相应的控件被选择,以实现对搜索结果的反馈。
如图2所示,在一个实施例中,步骤S10的具体过程为:
在步骤S101中,通过所述反馈信息控件的选择,获取缺陷编码,并采集关键词修改信息,以得到记录了所述缺陷编码和关键词修改信息的用户反馈信息。一实施例中,通过用户对反馈信息控件的选择,获取与反馈信息控件一一对应的缺陷编码,以获知搜索结果中存在的缺陷因子。采集关键词修改信息,从而了解到在搜索的过程中关键词是否被调整及替换,并获取修改后的关键词。通过关键词对互联网中的海量网页进行搜索,以得到搜索结果,针对搜索结果实时反馈用户意见。
在步骤S102中,构建会话,将所述用户反馈信息打包生成会话数据包并发送。一实施例中,会话是指用户与浏览器之间交互的过程,包括关键词的输入与替换、用户反馈的输入与接收。为找到想要的搜索结果,用户进行了多次调整及替换关键词和反馈信息控件的选择,例如调整了搜索的关键词、点击了下一页、选择了反馈信息控件,若用户没有更换关键词,只是选择了反馈信息控件或者只是更换了重合度较高的关键词,则属于同一个会话,反之,则认为是一个新的会话。而会话是以Cookie形式保存在浏览器中,其内容包括:、搜索结果的点击情况(例如点击了第几条结果,网页网址是什么等)、用户反馈信息以及搜索引擎策略。具体地,构建会话是在开始搜索时就以Cookie的形式保存所使用的关键词、搜索结果的点击情况、选择的反馈信息控件以及搜索引擎策略。打包了关键词修改信息和缺陷编码的会话数据包被发送至引擎服务器中,以实现反馈信息的实时交互。
另一实施方式中,发送会话数据包的步骤之前还包括了加密会话数据包以及解密新搜索引擎策略的步骤。一实施例中,为保证数据安全,会话数据必须经过加密之后才可以发送到搜索引擎服务器中,而通过浏览器与搜索引擎服务器的数据交互过程中,对于搜索引擎服务器发送给浏览器的新搜索引擎策略必须经过解密的过程。
在步骤S20中,根据用户反馈信息调整搜索引擎策略,根据所述调整后的新搜索引擎策略进行网页搜索。如图4所示,在一个实施例中,步骤S20的具体过程为:
在步骤S201中,接收所述会话数据包。一实施例中,接收浏览器中的会话数据包。在另一个实施例中,接收会话数据的步骤之后还包括解密会话数据包的步骤。
在步骤S202中,解析所述会话数据包获取所述用户反馈信息,并根据所述用户反馈信息中的关键词修改信息计算与原关键词的重合度。一实施例中,计算原关键词与新输入的关键词的重合度,如果原关键词与新关键词的重合度小于所设定的重合度阈值,则清空会话信息,并新建会话,如果计算得到的重合度超过重合度阈值,则是继续沿用原会话信息。例如,用户对关键词“六十周年国庆阅兵”进行搜索,发现第一页结果中有几篇关于国外的阅兵,而他关心的只是中国的六十周年国庆阅兵,于是就调整关键词为“国庆大阅兵”,经过计算“六十周年国庆阅兵”和“国庆大阅兵”的重合度,发现两个关键词的重合度超过了所设定的重合度阀值,是属于同一个会话,于是继续沿用原会话信息。会话的意义在于保留交互过程中的信息,如果开始了新的会话,则之前所保留的信息就无用了。对会话而言,其保存了所有使用过的关键词、搜索结果的点击情况、反馈信息以及历史搜索引擎策略。
在步骤S203中,解析所述缺陷编码,获取用户的反馈信息。一实施例中,每一个反馈信息控件都相对应的有一个缺陷编码,通过解析缺陷编码,进行反馈信息的还原,以得到用户反馈信息。
在步骤S204中,根据所述用户反馈信息和原搜索引擎策略,调整搜索引擎策略。一实施方式中,根据反馈信息、搜索结果的点击情况、关键词修改信息以及原搜索引擎策略,调整策略因子权重,生成新搜索引擎策略重新处理搜索结果。一实施例中,依据反馈信息,调整页面质量、站点声望、文本相关度、用户的历史点击反馈、时新性等策略因子的权重值,使得搜索引擎根据调整后的策略因子权重值重点选择网页。在另一个实施例中,调整搜索引擎策略的步骤之后还包括加密所述调整后的搜索引擎策略的步骤。
图5示出了一个实施例中网页搜索的系统模块,该系统包括浏览器10、搜索引擎服务器20,其中:
浏览器10用于获取用户反馈信息。一实施方式中,用户反馈信息记录了用户对于搜索结果的不满意见。在获取用户反馈信息之前,浏览器10包括了提供并设置反馈信息控件的输入模块101,缺陷编码与反馈信息控件一一对应。如前所述,在网页中设置各种反馈信息控件,使反馈信息控件表示其搜索结果中的缺陷因子,并相对应一个缺陷编码。通过用户对多个反馈信息控件的选择来获得反馈信息。
一实施例中,如图6所示,浏览器10还包括反馈采集模块102、会话构建模块103以及第一通信模块104其中:
反馈采集模块102用于通过所述反馈信息控件的选择,获取缺陷编码,并采集关键词修改信息,以得到记录了所述缺陷编码和关键词修改信息的用户反馈信息。一实施例中,根据浏览器窗口获取关键词以及调整替换后的关键词,以得到包括了关键词修改信息和缺陷编码的用户反馈信息。对互联网当中的海量网页进行搜索,以得到搜索结果。用户根据得到的搜索结果,实时返回搜索引擎策略中的反馈信息。
会话构建模块103用于构建会话,将所述用户反馈信息打包生成会话数据包。一实施例中,会话是用户与浏览器相互之间进行交互的过程,用户输入关键词及选择反馈信息控件后便开始了会话的过程。而为了找到理想的搜索结果,用户通常进行多次更换关键词和选择反馈信息控件,如果用户没有更换关键词,而只是选择了反馈信息控件或者只是更换了重合度较高的关键词,则属于同一会话,反之,则是一新的会话。会话以Cookie的形式保存于浏览器中,记录了在该会话中所使用和更换的关键词、搜索结果的点击情况(如点击了第几条结果,网页网址是什么等)以及搜索引擎策略。具体地,构建会话是在开始搜索时通过关键词,以Cookie的形式保存搜索结果的点击情况、用户反馈信息以及搜索引擎策略。
第一通信模块104用于发送所述会话数据包。在另一个实施例中,该浏览器10在第一通信模块104之后还包括第一加解密模块(图中未示出),该第一加解密模块用于加密会话数据包以及解密返回的新搜索引擎策略。一实施例中,为保证数据安全,会话数据须经过加密之后才可以发送到搜索引擎服务器20中,而在浏览器10与搜索引擎服务器20的数据交互过程中,对于搜索引擎服务器20发送给浏览器10的新搜索引擎策略必须经过解密的过程。
搜索引擎服务器20用于根据用户反馈信息调整搜索引擎策略,根据所述调整后的新搜索引擎策略进行网页搜索。一实施例中,如图7所示,搜索引擎服务器20包括第二通信模块201、会话处理模块202、反馈解析模块203以及策略调整模块204,其中:
第二通信模块201用于接收所述会话数据包并返回所述新搜索引擎策略及搜索结果。一实施例中,搜索引擎服务器20通过第二通信模块201接收浏览器10中的会话数据包。该第二通信模块201进一步用于向浏览器10返回调整后的新搜索策略及搜索结果。在另一个实施例中,该搜索引擎服务器20中的第二通信模块201还包括第二加解密模块(图中未示出),该经第二加解密模块用于在接收所述会话数据包之后解密所述会话数据包以及在返回所述新搜索引擎策略及搜索结果之前加密所述新搜索引擎策略。
会话处理模块202用于解析所述会话数据包获取用户反馈信息,并根据用户反馈信息中的关键词修改信息计算原关键词与新关键词的重合度。一实施例中,计算原关键词与新输入的关键词的重合度,如果原关键词与新关键词的重合度小于所设定的重合度阈值,则清空会话信息,并新建会话,如果计算得到的重合度超过重合度阈值,则是继续沿用原会话信息。如前所述,当前会话保存了所有搜索结果的点击情况、用户反馈信息以及历史搜索引擎策略。
解析模块203用于解析所述缺陷编码,获取用户的反馈信息。一实施例中,每一个反馈信息控件都相对应的有一个缺陷编码,通过解析该缺陷编码,进行反馈信息还原,以得到用户的反馈信息。
策略调整模块204用于根据所述用户反馈信息和原搜索引擎策略,调整搜索引擎策略。一实施例中,根据用户反馈信息、搜索结果的点击情况以及原搜索引擎策略,调整策略因子权重,生成新搜索引擎策略,并重新处理搜索结果。
下面结合一个具体的实施例详细阐述上述网页搜索方法及系统的应用过程。该实施例中,如图3所示,输入模块101设置了反馈信息控件,用户输入关键字“国庆大阅兵”,此时为用户的第一次搜索,还没有建立会话,则只有关键词被会话构建模块103打包生成会话数据包,加密并发送到搜索引擎服务器20中,并新建一个会话(如分配一个会话ID)。第二通信模块201接收会话数据包,会话处理模块202根据默认搜索引擎策略选择网页生成搜索结果,并将默认搜索引擎策略加密后与搜索结果一起送到用户的浏览器10,由会话构建模块103存储于浏览器10中。
而用户觉得搜索结果中多为往年的、且基本都是新闻报道、没有视频链接,则在浏览器10的控件中选择“时间太旧”、“结果单一”、“没有视频”,然后点击“反馈”,反馈采集模块102获取用户反馈信息,如“结果单一”就对应着一个缺陷编码,会话构建模块103构建会话,将搜索结果的点击情况、用户反馈信息以及所使用的搜索引擎策略保存在浏览器10中,第一通信模块104将采集到的关键词修改信息和缺陷编码加密打包生成会话数据包,发送至搜索引擎服务器20中。
第二通信模块201接收会话数据包,并通过第二加解密模块解密后,会话处理模块202解析会话数据包以获取用户反馈信息,解析模块203解析缺陷编码,将用户反馈信息还原出来。策略调整模块204根据用户反馈信息和默认搜索引擎策略,调整搜索引擎策略,根据用户反馈信息,发现用户希望结果多样化,有视频,是最近的新闻,于是参考上一次的搜索引擎策略调整搜索引擎策略,将“多样化”、“有视频”、“时新性”的策略因子的权重提高,新的搜索引擎策略也被第二加解密模块加密并重新选择网页得到搜索结果,浏览器10的第一加解密模块解密新搜索引擎策略,新搜索引擎策略被会话构建模块103保存于会话中。此时用户发现第一页搜索结果中有几篇是关于国外的阅兵,而他只关心中国的六十周年国庆阅兵,于是便调整关键词为“六十周年国庆阅兵”,新的关键词被会话构建模块103加入到会话中,打包送到搜索引擎服务器20,会话处理模块202解析到新的关键词,计算其与原关键词的重合度,发现新的关键词(“六十周年国庆阅兵”)和老的关键词(“国庆大阅兵”)重合度超过了设定的重合度阀值,则告知策略调整模块204关键词被修改,于是策略调整模块204提高“六十周年”的文本相关度权重,并滤掉国外的阅兵相关的网页。新的搜索引擎策略被第二加解密模块加密并重新选择网页,发送到浏览器10中,浏览器10的第一加解密模块解密搜索引擎策略并显示新的搜索结果,搜索引擎策略和用户反馈信息被会话构建模块103保存于会话中。
上述网页搜索方法及系统的方法及系统通过浏览器窗口实时获取用户针对搜索结果选择的反馈信息控件和对关键词的修改信息以得到反馈信息,并根据反馈信息分析理解从而调整搜索引擎策略,重新选择网页生成搜索结果,从而使得用户可在搜索的同时针对搜索结果提出实时意见,以得到理想的搜索结果。
另外,在搜索引擎中引入了会话的过程,使用户的调整关键词、翻页等动作对搜索引擎而言成为一次次相互联系的行为,实现了用户与搜索引擎间的交互,优化了搜索引擎策略,能让用户及时获取搜索结果,满足了用户需求。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。