【发明内容】
基于此,有必要提供一种无需人工操作也能提高搜索准确性的搜索方法。
一种搜索方法,包括以下步骤:
根据输入的搜索关键词在搜索数据库中进行搜索,返回搜索结果;
获取用户对搜索结果的反馈信息;
根据所述反馈信息判断对应的搜索结果是否为垃圾数据,如果是,则将反馈信息及对应的搜索结果加入垃圾数据库中,如果不是,则将反馈信息及对应的搜索结果加入所述搜索数据库中。
优选的,所述方法还包括:
当根据所述反馈信息判定对应的搜索结果是垃圾数据时,将所述反馈信息及对应的搜索结果提交给审核子系统,通过所述审核子系统判断所述搜索结果是否为垃圾数据,若是垃圾数据,则将所述反馈信息及对应的搜索结果加入垃圾数据库中,否则,将所述反馈信息及对应的搜索结果加入搜索数据库中。
优选的,所述反馈信息包括反馈关键词;所述根据所述反馈信息判断对应的搜索结果是否为垃圾数据的步骤为:
标记所述反馈关键词被反馈的次数,若所述被反馈的次数超过阈值,则判定对应的搜索结果为垃圾数据,否则不是垃圾数据。
优选的,所述反馈信息还包括反馈关键词的索引号、反馈时间、反馈内容、用户标识号和用户IP地址;
获取用户对搜索结果的反馈信息之后还包括:
将搜索结果及对应的反馈信息存储到反馈信息库中,并从反馈信息库中提取反馈信息。
优选的,所述获取用户对搜索结果的反馈信息的步骤为:
在显示搜索结果的页面上提供用户输入反馈信息的对话框,通过所述对话框获取用户输入的对搜索结果的反馈信息。
此外,还有必要提供一种能提高搜索准确性的搜索系统。
一种搜索系统,包括:
搜索数据库,用于存储搜索数据;
搜索模块,用于根据用户输入的搜索关键词在所述搜索数据库中进行数据搜索,返回搜索结果;
信息获取模块,用于获取用户对搜索结果的反馈信息;
检测模块,用于根据所述反馈信息判断对应的搜索结果是否为垃圾数据,如果是,则将反馈信息及对应的搜索结果加入垃圾数据库中,如果不是,则将反馈信息及对应的搜索结果加入所述搜索数据库中;
垃圾数据库,用于存储判定为垃圾数据的搜索结果及对应的反馈信息。
优选的,所述系统还包括用于提供人工审核的审核子系统;所述检测模块还用于当根据所述反馈信息判定对应的搜索结果是垃圾数据时,将反馈信息及对应的搜索结果提交给审核子系统;
所述审核子系统用于判断所述搜索结果是否为垃圾数据,若是垃圾数据,则将所述反馈信息及对应的搜索结果加入所述垃圾数据库中,否则,将所述反馈信息及对应的搜索结果加入所述搜索数据库中。
优选的,所述反馈信息包括反馈关键词;所述检测模块还用于标记所述反馈关键词被反馈的次数,若所述被反馈的次数超过阈值,则判定对应的搜索结果垃圾数据,否则不是垃圾数据。
优选的,所述反馈信息还包括反馈关键词的索引号、反馈时间、反馈内容、用户标识号和用户IP地址;
所述信息获取模块还用于将搜索结果及对应的反馈信息存储到反馈信息库中;所述系统还包括用来存储所述反馈信息及对应的搜索结果的反馈信息库;所述检测模块还用于从反馈信息库中提取反馈信息。
优选的,所述信息获取模块用于在显示搜索结果的页面上提供用户输入反馈信息的对话框,通过所述对话框获取用户输入的对搜索结果的反馈信息。
上述搜索方法及系统,根据用户对搜索结果的反馈信息判定搜索结果是否为垃圾数据,当搜索结果不为垃圾数据时,则加入到搜索数据库中,由于搜索数据库整合了用户对搜索结果的反馈信息,在搜索数据库中进行数据搜索得到的结果更准确,无需人工操作也能提高了搜索的准确性,减少了后台的工作量。
此外,在根据反馈信息判断对应的搜索结果是垃圾数据时,还可以将这些反馈信息及对应的搜索结果交给审核子系统进行人工审核,实现二次审核,在人工审核不为垃圾数据时,再加入到搜索数据库,使得搜索数据库中整合的用户的反馈信息更准确,进一步提高了搜索的准确性。通过获取用户对搜索结果的反馈信息,能够对搜索数据库中的数据进行优化,例如过滤掉低质量的数据等;同时也能获取用户对资源的感兴趣点,使得搜索系统能更好的提供个性化服务。
【具体实施方式】
图1示出了一个实施例中搜索方法的流程,该方法流程包括以下步骤:
步骤S102,根据输入的搜索关键词在搜索数据库中进行搜索,返回搜索结果。
步骤S104,获取用户对搜索结果的反馈信息。
步骤S106,根据反馈信息判断对应的搜索结果是否为垃圾数据,若是则进入步骤S108,否则进入步骤S110。
步骤S108,将反馈信息及对应的搜索结果加入垃圾数据库。
步骤S110,将反馈信息及对应的搜索结果加入到搜索数据库中。由于搜索数据库中整合了不是垃圾数据的反馈信息及对应的搜索结果,在提供数据搜索时能得到更准确的搜索结果,无需人工操作也能提高了搜索的准确性,减少了后台的工作量。
另外,获取到用户对搜索结果的反馈信息,则能够根据用户对搜索结果的反馈对搜索数据库中的数据进行优化,例如过滤掉低质量的数据等。同时也能获取用户对资源的感兴趣点,使得搜索系统能更好的提供个性化服务。
图2示出了另一个实施例中的搜索方法的流程,该方法流程包括以下步骤:
步骤S202,根据输入的搜索关键词在搜索数据库中进行数据搜索,返回搜索结果。用户通过输入框输入要查询的内容,搜索引擎根据用户输入的搜索关键词在搜索数据库中进行数据搜索,在页面上逐条显示搜索得到的结果,用户通过点击每条搜索结果可以进入相应的页面。
步骤S204,获取用户对搜索结果的反馈信息,将搜索结果及对应的反馈信息存储到反馈信息库中。在一个实施例中,在显示搜索结果的页面上提供用户输入反馈信息的对话框,用户通过对话框输入反馈信息或选择相应项目,通过对话框获取用户对搜索结果的反馈信息。
如图3所示,在页面上逐条显示得到的搜索结果,在每条搜索结果上提供了用户反馈接口的图标,如图3中的星星图标,用户点击该图标,在页面上(如星星图标的右上角)弹出反馈信息输入对话框,提示用户输入反馈信息。
反馈信息输入对话框可以设置多种形式,例如提供选项供用户选择或提供输入框供用户输入具体反馈内容等。用户选择项目和/或输入信息后点击确定即提交成功。在一个优选的实施例中,可通过改变接口图标的颜色来显示用户是否已提交该条搜索结果的反馈信息。可以设置在一定时间内对于同一搜索结果同一用户只能反馈一次,这样,能够得到更加准确的反馈信息。
在将反馈信息存储到反馈信息库之前,可以对反馈信息进行过滤等操作,提取其中的反馈关键词,在反馈信息库中存储的反馈信息包括:反馈关键词的索引号、反馈关键词、反馈时间、反馈内容、用户标识号和用户IP地址等。
步骤S206中,从反馈信息库中定时或不定时提取反馈信息。
在一个优选的实施例中,可以每隔24小时从反馈信息库中提取用户对搜索结果的反馈信息。对每条搜索结果,提取的反馈信息包括反馈关键词的索引号、关键词、反馈时间、反馈内容、用户标识号和用户IP地址等。
步骤S208,根据反馈信息判断对应的搜索结果是否为垃圾数据,若是,则进入步骤S210,否则进入步骤S216。
在一个实施例中,步骤S208的具体过程是:判断反馈关键词是否在垃圾数据库中存在,若是,则判定对应的搜索结果为垃圾数据,否则不为垃圾数据。
在另一个实施例中,步骤S108的具体过程是:标记反馈关键词被反馈的次数,当反馈关键词被反馈的次数超过阈值时,则判定对应的搜索结果为垃圾数据,否则不为垃圾数据。
步骤S210,将反馈信息及对应的搜索结果提交给审核子系统。可以通过审核子系统在后台对反馈信息进行人工审核,实现二次审核,在人工审核不为垃圾数据时,再将反馈信息及对应的搜索结果加入到搜索数据库,使得搜索数据库中整合的用户的反馈信息更准确,进一步提高了搜索的准确性。
步骤S212,通过审核子系统判断搜索结果是否为垃圾数据,若是,则进入步骤S214,否则进入步骤S216。
步骤S214,将反馈信息及对应的搜索结果加入垃圾数据库中。加入到垃圾数据库中的反馈信息的数据结构包括反馈关键词的索引号、反馈关键词、反馈时间、反馈内容、用户标识号和用户IP地址等。
由于定时或不定时从反馈信息库中提取反馈信息,并判断其对应的搜索结果是否为垃圾数据,通过审核子系统进行人工审核,能定时或不定时的对垃圾数据库中的数据进行更新,为后续的反馈信息的分析提供了依据。
步骤S216,将反馈信息及对应的搜索结果加入到搜索数据库中。
图4示出了一个实施例中的搜索系统,该系统包括搜索数据库100、搜索模块200、信息获取模块300和检测模块400,其中:
搜索数据库100用于存储搜索数据。
搜索模块200用于根据用户输入的搜索关键词在搜索数据库100中进行数据搜索,返回搜索结果。
信息获取模块300用于获取用户对搜索结果的反馈信息。
检测模块400用于根据反馈信息判断对应的搜索结果是否为垃圾数据,如果是,则将反馈信息及对应的搜索结果加入垃圾数据库500中,如果不是,则将反馈信息及对应的搜索结果加入搜索数据库100中。
垃圾数据库500,用于存储判定为垃圾数据的搜索结果及对应的反馈信息。
图5示出了另一个实施例中的搜索系统,该系统在图4所示实施例的基础上还包括反馈信息库600和审核子系统700。其中:
反馈信息库600用于存储信息获取模块300获取到的搜索结果及对应的反馈信息。检测模块400用于从反馈信息库600中定时或不定时的提取反馈信息,根据提取的反馈信息判定搜索结果是否为垃圾数据。
审核子系统700提供人工审核。检测模块400还用于当判定反馈信息对应的搜索结果是垃圾数据时,将反馈信息及对应的搜索结果提交给审核子系统700。审核子系统700用于判断搜索结果是否为垃圾数据,若是,则将反馈信息及对应的搜索结果加入垃圾数据库500中,否则,将反馈信息及对应的搜索结果加入搜索数据库100中。
在一个实施例中,信息获取模块300用于在显示搜索结果的页面上提供用户输入反馈信息的对话框,通过入对话框获取用户对搜索结果的反馈信息。
如图3所示,在页面上逐条显示得到的搜索结果,在每条搜索结果上提供了用户反馈接口的图标,如图3中的星星图标,用户点击该图标,在页面上(如星星图标的右上角)弹出反馈信息输入对话框,提示用户输入反馈信息。
反馈信息输入对话框可以设置多种形式,例如提供选项供用户选择或提供输入框供用户输入具体反馈内容等。用户选择项目和/或输入信息后点击确定即提交成功。在一个优选的实施例中,可通过改变接口图标的颜色来显示用户是否已提交该条搜索结果的反馈信息。可以设置在一定时间内对于同一搜索结果同一用户只能反馈一次,这样,能够得到更加准确的反馈信息。
在将反馈信息存储到反馈信息库600之前,可以对反馈信息进行过滤等操作,提取其中的反馈关键词,在反馈信息库中存储的反馈信息包括:反馈关键词的索引号、反馈关键词、反馈时间、反馈内容、用户标识号和用户IP地址等。
在一个实施例中,检测模块400用于判断反馈关键词是否在垃圾数据库500中存在,若是,则判定对应的搜索结果为垃圾数据,否则不为垃圾数据。
在另一个实施例中,检测模块400还用于标记反馈关键词被反馈的次数,若被反馈的次数超过阈值,则判定对应的搜索结果为垃圾数据,否则不是垃圾数据。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。