WO2014056337A1

WO2014056337A1 - 搜索词获取方法、服务器、搜索词推荐系统

Info

Publication number: WO2014056337A1
Application number: PCT/CN2013/079173
Authority: WO
Inventors: 曹远铖; 曹越; 尹华彬; 宁合军; 宫建涛
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2012-10-09
Filing date: 2013-07-11
Publication date: 2014-04-17
Also published as: US20150213042A1; CN103714088A

Abstract

本发明提出了一种搜索词获取方法、服务器、搜索词推荐方法及系统以及存储介质，其搜索词获取方法包括：设置标签库，所述标签库中存储有多个标签、多个类别及多个应用关键词，其中一个类别对应多个标签，一个应用关键词对应至少一个标签，一个标签对应至少一个类别；判断接收到的应用关键词是否为模糊关键词；若是，则根据接收到的应用关键词获得与接收到的应用关键词匹配的标签；根据所述匹配的标签获得与所述匹配的标签对应的类别；对获得的类别进行汇总，找出其中出现次数最多的类别；找出与出现次数最多的类别对应的标签作为推荐的搜索词。本发明可以在用户的主观搜索目的不明确的情况下，挖掘出用户潜在的需求，或者细化用户的需求，使搜索结果更符合用户意图，具有很强的实用性。

Description

说明书

搜索词获取方法、服务器、搜索词推荐系统本专利申请要求于 2012年 10月 9 日提交的、申请号为 201210379599.5、申请人为腾讯科技（深圳）有限公司、发明名称为 "搜索词获取方法、服务器、搜索词推荐方法及系统" 的中国专利申请的优先权，该申请的全文以引用的方式并入本申请中。技术领域

本发明涉及一种计算机的网络搜索技术，特别涉及一种搜索词获取方法、服务器、搜索词推荐方法及系统以及存储介质。背景技术

随着 WEB2. 0技术的迅猛发展，互联网数据海量增长。如何为互联网用户提供准确有效的信息显得尤为重要。通用搜索引擎的搜索策略是尽量获取数据，但是对数据的处理水平比较低，如百度、谷歌等通用搜索引擎，通常是根据输入的关键字的相似度罗列大量的搜索结果。其突出问题就是：在搜索结果中，无价值信息过多、有效信息不足且非结构化、以及返回搜索结果无个性化机制。通用搜索引擎提供的搜索结果中无价值数据的比例较高，这些对用户无价值的数据浪费了数据中心相当多的存储和运算能力，意味着不仅单次搜索消耗的能源浪费比例高，还会干扰有效信息的提取，致使用户很可能需要进行多次搜索。

垂直搜索引擎是相对于通用搜索引擎的信息量大、查询不准确、深度不够等问题所提出来的新的搜索引擎服务模式，该模式针对某一特定领域、某一特定人群或某一特定需求提供有一定价值的信息和相关服务，其特点就是 "专、精、深"，且具有行业色彩，与通用搜索引擎的海量信息无序化相比，垂直搜索引擎则显得更加专注、具体和深入。但是，由于垂直搜索引擎所具有的行业特点，因而其数据量有限，用户需要在不同领域进行搜索时，不得不使用不同的垂直搜索引擎，操作上较为不便。

此外，用户在搜索时，由于不同用户在主观上存在差异性，所以很多时候因为不能提供准确的关键词而导致无法获得想要的搜索结果，因而在现有技术中，不管是通用搜索引擎还是垂直搜索引擎，均不具备根据用户提供的模糊关键词向用户推荐搜索词、进而推荐搜索结果的功能，因此无法满足用户的潜在搜索需求，具有一定局限性。发明内容

本发明实施例提供一种搜索词获取方法、服务器、搜索词推荐方法及系统以及存储介质，以解决通用搜索引擎对数据的处理能力低、垂直搜索引擎操作不便、以及现有的搜索引擎无法向用户智能化推荐搜索词、进而推荐搜索结果的问题。

本发明提出了一种搜索词获取方法，运行于服务器端，其特征在于，所述方法包括：

设置标签库，所述标签库中存储有多个标签、多个类别及多个应用关键词；判断接收到的应用关键词是否为模糊关键词；

若接收到的应用关键词是模糊关键词，则根据接收到的应用关键词获得与接收到的应用关键词匹配的标签；

根据所述匹配的标签获得与所述匹配的标签对应的类别；

对获得的所述类别进行汇总，确定其中出现次数最多的类别；

确定与出现次数最多的类别对应的标签作为推荐的搜索词。

本发明还提出了一种服务器，其特征在于，包括：

标签库，所述标签库中存储有多个标签、多个类别及多个应用关键词；匹配单元，用于在接收应用关键词后，判断接收到的应用关键词是否为模糊关键词，若接收到的应用关键词是模糊关键词，则根据接收到的应用关键词获得与接收到的应用关键词匹配的标签；

汇总单元，用于根据所述匹配单元获得的匹配的标签获得与所述匹配的标签对应的类别，并对获得的所述类别进行汇总，找出其中出现次数最多的类别；推荐词输出单元，用于确定与所述出现次数最多的类别对应的标签作为推荐的搜索词。

本发明还提出了一种搜索词推荐系统，其特征在于，包括服务器与至少一个用户端，所述用户端用于向所述服务器发送应用关键词，以及接收所述服务器返回的推荐的搜索词并向用户展现，所述服务器进一步包括：

标签库，所述标签库中存储有多个标签、多个类别及多个应用关键词；匹配单元，用于接收所述用户端发送的应用关键词，并判断接收到的应用关键词是否为模糊关键词，若接收到的应用关键词是模糊关键词，则根据接收到的应用关键词获得与接收到的应用关键词匹配的标签；

汇总单元，用于根据所述匹配单元获得的所述匹配的标签获得与所述匹配的标签对应的类别，并对获得的所述类别进行汇总，找出其中出现次数最多的类别；

推荐词输出单元，用于确定与所述出现次数最多的类别对应的标签作为推荐的搜索词。

相对于现有技术，本发明实施例可以通过由用户直接输入的或由通用搜索引擎的搜索结果导出的应用关键词，找出相同功能特性且热门的推荐词，并展现给用户，从而在用户的主观搜索目的不明确的情况下，可以挖掘出用户潜在的需求，或者细化用户的需求，使搜索结果更符合用户意图，具有很强的实用性。附图说明

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段从而可依照说明书的内容予以实施，并且为了让本发明的上述特征和优点能够更明显易懂，以下特举较佳实施例，并配合附图，详细说明如下，其中：图 1为根据本发明实施例的一种搜索词获取方法的流程图；

图 2为根据本发明实施例的搜索过程的示意图；

图 3为根据本发明实施例的另一种搜索词获取方法的流程图；

图 4为根据本发明实施例的一种搜索词推荐方法的流程图；

图 5为根据本发明实施例的另一种搜索词推荐方法的流程图；

图 6为根据本发明实施例的一种服务器的结构图；

图 7为根据本发明实施例的另一种服务器的结构图；图 8为根据本发明实施例的一种搜索词推荐系统的结构图；

图 9为根据本发明实施例的一种类别、标签、应用关键词的对应关系图。具体实施方式附图及较佳实施例，详细说明本发明提出的搜索词获取方法、服务器、搜索词推荐方法及系统的具体实施方式、方法、步骤及技术效果，且说明相应的存储介质。本发明可以根据输入的关键词寻找出用户的隐含需求，并输出推荐的搜索词。请参见图 1 , 其为根据本发明实施例的一种搜索词获取方法的流程图，该方法运行于服务器端，且包括以下步骤 S1 1-S16 :

S11 :设置标签库。所述标签库中存储有多个标签、多个类别及多个应用关键词，其中每个类别包含多个标签，每个应用关键词对应至少一个标签，每个标签属于至少一个类别。

请参见图 9 ,应用关键词是指用户想要搜索的内容，标签库为可能输入的应用关键词配置对应的标签，该标签需要涵盖应用关键词的各类特性。例如，如果应用关键词是 "愤怒的小鸟"，则可以为其配置对应的标签 "卡通"、 "益智"、 "投掷 "，又例如应用关键词是 "微信"，则可以为其配置对应的标签 "对讲"、 "聊天"、 "语音"、 "传文件"、 "记事"。应用关键词与标签的对应关系是根据数据挖掘及人工校验的机制进行配置的。

另外，每个标签与至少一个类别相对应，类别与标签的对应关系按照标签的功能特性进行分类。例如标签 "闹钟"、 "杀木马"、 "看小说" 对应于一个类别 "功能标签"，又如标签 " 3D"、 "横屏"、 "竖屏" 对应于一个类别 "界面"，标签 "重力感应"、 "蓝牙联网" 对应于一个类别 "特性"。

S12:判断接收到的所述应用关键词是否为模糊关键词。

本实施例中，应用关键词可以是由用户直接输入，也可以是通用搜索引擎或垂直搜索引擎的输出结果。比如，用户可以直接键入 "愤怒的小鸟" 作为应用关键词，用户也可以将 "愤怒的小鸟" 输入通用搜索引擎，由通用搜索引擎得出一个搜索结果列表（通常称之为 APP特性列表），这个搜索结果列表中可能包含 "愤怒的小鸟返校版、愤怒的小鸟太空版、愤怒的小鸟高清版… "，然后将这个搜索结果列表中每一个结果导出作为应用关键词。

这里所述的模糊关键词是指用户主观意思不明确的词，可以通过对应用关键词设置相关性分值来确定其是否为模糊关键词。例如当用户输入 "QQ2012 " 时，用户是想要搜索一款具体的软件，其搜索目的较为明确，无需向用户展现推荐词，可以直接釆用通用搜索引擎以应用关键词 "QQ2012" 作为搜索词进行搜索，因而可以为 "QQ2012 "设置较高的分值。而如果用户输入 "腾讯" 进行搜索时，其可能想要搜索的是腾讯公司旗下的某一类软件，这时搜索目的较为模糊，因而可以为 "腾讯" 设置较低的分值，并进入下一步骤。在这里，为了判断相关性分值的高低，可以在标签库中预先设置相关性分值阔值，当应用关键词的相关性分值低于该阔值时，判断该应用关键词为模糊关键词；否者，判断该应用关键词并非是模糊关键词。当然，也可以釆用其它的预设标准来判断应用关键词是否为模糊关键词。该判断方式也类似适用于以下实施例。

在标签库中可以为每个存储的应用关键词存储对应的相关性分值，在收到应用关键词后，在标签库中找到与接收到的应用关键词一致的存储的应用关键词，获得与该存储的应用关键词对应的相关性分值，作为接收到的应用关键词的相关性分值用于判断接收到的应用关键词是否为模糊关键词。

S13: 若接收到的应用关键词是模糊关键词，则根据接收到的应用关键词获得与其匹配的标签；否者，将接收到的应用关键词直接作为搜索词。

接收到应用关键词后，根据标签库对其进行标签匹配，并从标签库中获得与接收到的应用关键词相匹配的标签；具体而言，在标签库中找到与接收到的应用关键词一致的存储的应用关键词，并获得与该存储的应用关键词匹配的标签，作为与接收到的应用关键词相匹配的标签。如根据应用关键词 "愤怒的小鸟" 获得匹配的三个标签 "卡通"、 "益智"、 "投掷"。

S14: 根据所述匹配的标签获得与所述匹配的标签对应的类别。

每个标签都有其对应的类别，类别与标签的对应关系按照标签的功能特性进行分类。在本步骤中可以获得一个或多个类别（如果将搜索引擎的搜索结果作为应用关键词，则将可能得到大量的类别）。

S15: 对获得的所述类别进行汇总，找出其中出现次数最多的类别。

在本步骤中对上一步骤中获得的类别进行汇总，找出其中出现次数最多的类别，这个出现次数最多的类别也就是与用户搜索的内容相关性最大的类别。而步骤 S14和步骤 S15 中得出的标签与类别的对应结果可以称作为标签的属性分布。

S16: 找出与出现次数最多的类别对应的标签作为推荐的搜索词；优选是从标签库中找出与出现次数最多的类别对应的热门标签作为推荐的搜索词。

出现次数最多的类别即与用户搜索的内容相关性最大的类别，在这个类别中可能会包含多个标签，而其中每个标签的热门度可以是人工设置的或者根据被搜索次数的记录来确定的。比如类别 "界面" 下包含的三个标签 " 3D"、 "横屏"、 "竖屏"，其中 " 3D"这个标签因常常被搜索而被设置为最热门的标签，即如果类别 "界面" 是出现次数最多的类别，则本步骤会输出 " 3D"这个标签，并作为推荐的搜索词。当然，最终输出的搜索词也可以是多个，可以通过设置标签的热门阔值来实现。

为便于理解，下面以一个具体实例来说明整个搜索过程，请参见图 2 , 假设搜索引擎的搜索结果中输出一个应用关键词 "微信"，则通过标签库了找出 "微信" 所对应的五个标签：标签 1为 "对讲"、标签 2为 "聊天"、标签 3为 "语音"、标签 4为 "传文件"、标签 5为 "记事本"。然后通过对这五个标签进行属性类别汇总，得出标签 1、标签 2、标签 3同属于一个类别：属性 1 , 即 "腾讯"。可见在五个标签中， "腾讯" 这个类别出现了三次，是出现次数最多的类别。接着对类别 "腾讯" 进行扫描，得到其中最热门的标签 "QQ" ，最终将标签 "QQ " 作为推荐词输出给用户。以此类推，对搜索引擎的搜索结果中输出的每一个应用关键词进行检索推荐，并将与用户搜索内容潜在相关的推荐词展现给用户。因此，通过本发明能灵活地挖掘出用户潜在的需求，或者细化用户的需求，使搜索结果更符合用户意图。

请参见图 3 , 其为根据本发明实施例的另一种搜索词获取方法的流程图，该方法包括以下步骤 S31-S36 :

S31 : 设置标签库和特征库。

所述标签库中存储有多个标签、多个类别及多个应用关键词，其中每个类别包含多个标签，每个应用关键词对应至少一个标签，每个标签属于至少一个类别。

所述特征库中存储有多个近似标签，近似标签与标签库中的标签相对应。每个近似标签与标签库中对应的一个或多个标签功能特性相近似，即近似标签与对应的、来自标签库的标签属于同一类别。特征库的存在便于系统的扩展和冗善。

S32: 判断接收到的应用关键词是否为模糊关键词。

这里所述的模糊关键词是指用户主观意思不明确的词，可以通过对应用关键词设置相关性分值来确定其是否为模糊关键词。例如当用户输入 "QQ2012 " 时，用户是想要搜索一款具体的软件，其搜索目的较为明确，无需向用户展现推荐词，可以直接釆用通用搜索引擎以应用关键词 "QQ2012" 作为搜索词进行搜索，因而可以为 "QQ2012 "设置较高的分值。而如果用户输入 "腾讯" 进行搜索时，其可能想要搜索的是腾讯公司旗下的某一类软件，这时搜索目的较为模糊，因而可以为 "腾讯" 设置较低的分值，并进入下一步骤。

S33: 若接收到的应用关键词是模糊关键词，则根据接收到的应用关键词获得与其匹配的标签和 /或近似标签；否者，将接收到的应用关键词直接作为搜索词。

S34: 根据所述匹配的标签和 /或近似标签获得与所述匹配的标签和 /或近似标签对应的类别。

在应用关键词匹配过程中，可能会有特征库中的近似标签与其相匹配，而由于近似标签与其对应的、来自标签库的标签属于同一类别，因而同样也可以获得对应的类别。

S35: 对获得的所述类别进行汇总，找出其中出现次数最多的类别。

在上一步骤中可以获得多个类别（如果是由搜索引擎的搜索结果作为应用关键词则可能会得到大量的类别），在本步骤中对这些类别进行汇总，找出其中出现次数最多的类别，这个出现次数最多的类别也就是与用户搜索的内容相关性最大的类别。

S36 : 找出与出现次数最多的类别对应的标签和 /或近似标签作为推荐的搜索词；优选是找出与出现次数最多的类别对应的热门标签和 /或热门近似标签作为推荐的检索词。

出现次数最多的类别即与用户搜索的内容相关性最大的类别，在这个类别中可能会包含多个标签，而热门标签即可以作为推荐的搜索词展现给用户。

本发明还提出一种搜索词推荐方法，用于通过服务器向用户端推荐符合用户检索意图的搜索词，以充分满足用户的搜索需求，请参见图 4 , 其为本发明实施例的一种搜索词推荐方法的流程图，该方法包括以下步骤 S41-S48:

S41 : 在服务器上设置标签库。所述标签库中存储有多个标签、多个类别及多个应用关键词，其中每个类别包含多个标签，每个应用关键词对应至少一个标签，每个标签属于至少一个类别。每个标签与至少一个类别相对应，类别与标签的对应关系按照标签的功能特性进行分类。

S42: 用户端将用户想要搜索的应用关键词发送给服务器。

应用关键词是指用户想要搜索的内容，标签库为各种可能输入的应用关键词配置对应的标签，该标签需要涵盖应用关键词的各类特性。

S43: 服务器接收所述用户端发送的应用关键词，并判断接收到的应用关键词是否为模糊关键词。

这里所述的模糊关键词是指用户主观意思不明确的词，如上所述，可以通过对应用关键词设置相关性分值来确定其是否为模糊关键词。

S44: 若接收到的应用关键词是模糊关键词，则服务器根据接收到的应用关键词获得与接收到的应用关键词匹配的标签；否者，将接收到的应用关键词直接作为搜索词。

服务器接收到应用关键词后，根据标签库对接收到的应用关键词进行标签匹配，并获得与该应用关键词相匹配的标签，即在标签库中找到与接收到的应用关键词一致的预先存储的应用关键词并获得与该预先存储的应用关键词匹配的标签，作为与接收到的应用关键词匹配的标签。 S45: 服务器根据所述匹配的标签获得与所述匹配的标签对应的类别。

每个标签都有其对应的类别，类别与标签的对应关系按照标签的功能特性进行分类。

S46: 服务器对获得的所述类别进行汇总，找出其中出现次数最多的类别。在上一步骤中可以获得多个类别，在本步骤中对这些类别进行汇总，找出其中出现次数最多的类别，这个出现次数最多的类别也就是与用户搜索的内容相关性最大的类别。

S47: 服务器找出与出现次数最多的类别对应的标签作为推荐的搜索词，并将推荐的搜索词返回给所述用户端。优选地，服务器找出与出现次数最多的类别对应的热门标签作为推荐的搜索词，并将推荐的搜索词返回给所述用户端。

出现次数最多的类别即与用户搜索的内容相关性最大的类别，在这个类别中可能会包含多个标签，而其中每个标签的热门度可以是人工设置的或者根据被搜索次数的记录来确定的。

S48: 用户端将接收到的所述推荐的搜索词展现给用户。

请参见图 5 , 图 5为本发明实施例的另一种搜索词推荐方法的流程图，该方法包括步骤 S51-S58 :

S51 : 在服务器上设置标签库和特征库。

所述标签库中存储有多个标签、多个类别及多个应用关键词，其中每个类别包含多个标签，每个应用关键词对应至少一个标签，每个标签属于至少一个类别。每个标签至少会与一个类别相对应，类别与标签的对应关系按照标签的功能特性进行分类。

S52: 用户端将用户想要搜索的应用关键词发送给服务器。

应用关键词是指用户想要搜索的内容，标签库为各种可能输入的应用关键词配置对应的标签，该标签需要涵盖应用关键词的各类特性。 S53: 服务器接收所述用户端发送的应用关键词，并判断接收到的应用关键词是否为模糊关键词。

S54: 若接收到的应用关键词是模糊关键词，则服务器根据接收到的应用关键词获得与接收到的应用关键词匹配的标签和 /或近似标签；否者，将接收到的应用关键词直接作为搜索词。

S55: 服务器根据匹配的所述标签和 /或近似标签获得与所述匹配的标签和 / 或近似标签对应的类别。

S56: 服务器对获得的所述类别进行汇总，找出其中出现次数最多的类别。在上一步骤中可以获得多个类别，在本步骤中对这些类别进行汇总，找出其中出现次数最多的类别，这个出现次数最多的类别也就是与用户搜索的内容相关性最大的类别。

S57: 服务器找出与出现次数最多的类别对应的标签作为推荐的搜索词，并将推荐的搜索词返回给所述用户端。优选地，服务器找出与出现次数最多的类别对应的热门标签作为推荐的搜索词，并将推荐的搜索词返回给所述用户端。

S58: 用户端将接收到的所述推荐的搜索词展现给用户。

本发明还提出一种服务器，请参见图 6 , 其为本发明实施例的一种服务器的结构图，该服务器包括标签库 41、匹配单元 42、汇总单元 43以及推荐词输出单元 44。标签库 41分别与匹配单元 42、汇总单元 43以及推荐词输出单元 44 相连，汇总单元 43与匹配单元 42相连，推荐词输出单元 44与汇总单元 43相连。标签库 41中存储有多个标签、多个类别及多个应用关键词，其中每个类别包含多个标签，每个应用关键词对应至少一个标签，每个标签属于至少一个类别。

请参见图 9 , 应用关键词是指用户想要搜索的内容，标签库 41为各种可能输入的应用关键词配置对应的标签，标签需要涵盖应用关键词的各类特性。类别与标签的对应关系可以按照标签的功能特性进行分类。应用关键词与标签的对应关系可根据数据挖掘及人工校验的机制进行配置。例如，对于应用关键词

"愤怒的小鸟"，可以为其配置对应的标签 "卡通"、 "益智"、 "投掷"，又例如，对于应用关键词 "微信"，则可以为其配置对应的标签 "对讲"、 "聊天"、 "语音"、

"传文件"、 "记事"。应用关键词与标签的对应关系是根据数据挖掘及人工校验的机制进行配置的。每个标签与至少一个类别相对应，类别与标签的对应关系按照标签的功能特性进行分类。例如标签 "闹钟"、 "杀木马"、 "看小说" 对应到一个类别 "功能标签"，又如标签 "3D"、 "横屏"、 "竖屏"对应到一个类别 "界面"。

本实施例的服务器可以单独使用，接收由用户输入的应用关键词，也可以配合通用搜索引擎来使用，由通用搜索引擎输出的搜索结果可作为输入给本服务器的应用关键词。

工作时，当匹配单元 42接收到应用关键词时，通过标签库 41为该应用关键词获得该应用关键词匹配的标签。而每个标签都有其对应的类别，汇总单元 43通过标签库 41找出与匹配单元 42输出的每个标签所对应的类别，并对找出的类别进行汇总，找出其中出现次数最多的类别。最后，汇总单元 43将出现次数最多的类别输出给推荐词输出单元 44 ,由推荐词输出单元 44扫描标签库 41 , 找出该类别对应的标签作为推荐的搜索词，优选是找出该类别对应的热门标签作为推荐的搜索词。

出现次数最多的类别即与用户搜索的内容相关性最大的类别，在这个类别中可能会包含多个标签，而其中标签的热门度可以是人工设置的或者根据被搜索次数的记录来确定的。比如类别 "界面" 下包含三个标签 "3D"、 "横屏"、 "竖屏"，其中 "3D"这个标签因常常被搜索而被设置为最热门的标签，即如果类别 "界面 "是出现次数最多的类别，则推荐词输出单元 44将输出 " 3D"这个标签，并作为推荐的搜索词。当然，最终输出的搜索词也可以是多个，可以通过设置标签的热门阔值来实现。

特别的是，在匹配单元 42接收到应用关键词时，可以先判断接收到的所述应用关键词是否为模糊关键词，若不是则直接以所述应用关键词作为检索词进行搜索，若是则根据接收到的应用关键词获得与接收到的应用关键词匹配的标签。这里所述的模糊关键词是指用户主观意思不明确的词，可以通过对应用关键词设置相关性分值来确定其是否为模糊关键词。例如当用户输入" QQ2012 " , 这时用户是想要搜索一款具体的软件，其搜索目的较为明确，无需向用户展现推荐词，可以直接釆用通用搜索引擎以应用关键词 "QQ2012" 作为搜索词进行搜索，因而可以为 "QQ2012 "设置较高的分值。而如果用户输入 "腾讯" 进行搜索时，其可能想要搜索的是腾讯公司旗下的某一类软件，这时搜索目的较为模糊，因而可以为 "腾讯" 设置较低的分值，并进行进一步的搜索。

请参见图 7 , 其为本发明实施例的另一种服务器的结构图，该服务器包括标签库 41、匹配单元 42、汇总单元 43、推荐词输出单元 44以及特征库 45。标签库 41与特征库 45相连，且标签库 41和特征库 45均分别与匹配单元 42、汇总单元 43、推荐词输出单元 44相连，汇总单元 43与匹配单元 42相连，推荐词输出单元 44与汇总单元 43相连。

与图 4的实施例不同的是，本实施例的服务器还包括特征库 45。特征库 45 中存储有多个近似标签，近似标签与标签库 41中的标签相对应。每个近似标签与标签库中对应的一个或多个标签具有近似的功能特性，即近似标签与对应的、来自标签库的标签属于同一类别。当匹配单元 42接收到所述应用关键词后，可以从标签库 41中获得与该应用关键词匹配的标签和 /或从特征库 45中获得与该应用关键词匹配的近似标签，然后找出这些标签和 /或近似标签对应的类别。可见，可以通过向特征库 45中加入近似标签来完善系统的搜索功能，便于系统的扩展。

本发明还提出一种搜索词推荐系统，请参见图 8 , 其为本发明实施例的一种搜索词推荐系统的结构图，该搜索词推荐系统包括服务器 81与至少一个用户端 82 , 用户端 82通过网络与服务器 81连接。用户端 82可以是计算机、手机、平板电脑等终端，其用于供用户输入想要搜索的词或语句，并作为应用关键词发送给服务器 81。服务器 81利用用户端 82发送的应用关键词，获取符合用户潜在搜索意图的推荐的搜索词，并反馈给用户端 82 , 由用户端 82将推荐的关键词展现给用户，以使用户可以更加明确地进行搜索。其中，本实施例服务器 81的功能结构参见关于图 6和图 7的实施例中服务器的相关描述，在此不再赘述。

本发明可以通过用户直接输入的或从通用搜索引擎的搜索结果导出的应用关键词，找出具有相同功能特性且热门的推荐词，并展现给用户，从而在用户的主观搜索目的不明确的情况下，可以挖掘出用户潜在的需求或者细化用户的需求，使搜索结果更符合用户意图，具有很强的实用性。

本发明还提出了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由处理器运行时用于执行一种搜索词获取方法，所述方法包括：

根据所述匹配的标签获得与所述匹配的标签对应的类别；

对获得的所述类别进行汇总，找出其中出现次数最多的类别；

找出与出现次数最多的类别对应的标签作为推荐的搜索词。

本发明还提出了另一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由处理器运行时用于执行一种搜索词推荐方法，该方法用于通过服务器向用户端推荐符合用户意图的搜索词，其特征在于，所述服务器中设置有标签库，所述标签库中存储有多个标签、多个类别及多个应用关键词，所述搜索词推荐方法包括：

用户端将用户想要搜索的应用关键词发送给所述服务器；

所述服务器接收所述用户端发送的应用关键词，并判断接收到的所述应用关键词是否为模糊关键词；

若接收到的所述应用关键词是模糊关键词，则所述服务器根据接收到的应用关键词获得与接收到的应用关键词匹配的标签；所述服务器根据所述匹配的标签获得与所述匹配的标签对应的类别；所述服务器对获得的所述类别进行汇总 , 找出其中出现次数最多的类别；所述服务器找出与出现次数最多的类别对应的标签作为推荐的搜索词，并将推荐的搜索词返回给所述用户端；

所述用户端将接收到的所述推荐的搜索词展现给用户。

以上所述仅为本发明的较佳实施例，并非对本发明作任何形式上的限制，虽然本发明已通过以上较佳实施例得以披露，然而并非用以限定本发明。任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内，都可利用上述揭示的技术内容作出具有替换或修改的等效实施例，但凡是未脱离本发明技术方案均仍属于本发明技术方案的范围内。

Claims

权利要求书

1、一种搜索词获取方法，运行于服务器端，其特征在于，所述方法包括：设置标签库，所述标签库中存储有多个标签、多个类别及多个应用关键词；判断接收到的应用关键词是否为模糊关键词；

根据所述匹配的标签获得与所述匹配的标签对应的类别；

确定与出现次数最多的类别对应的标签作为推荐的搜索词。

2、如权利要求 1所述的搜索词获取方法，其特征在于，每个所述类别包含多个所述标签，每个所述应用关键词对应至少一个标签，每个标签属于至少一个类别。

3、如权利要求 1或 2所述的搜索词获取方法，其特征在于，

所述判断接收到的应用关键词是否为模糊关键词包括：判断所述接收到的

收到的应用关键词为模糊关键词；否则，确定接收到的应用关键词不是模糊关键词。

4、如权利要求 1或 2所述的搜索词获取方法，其特征在于，所述接收到的应用关键词由用户输入或来自搜索引擎输出的搜索结果。

5、如权利要求 1或 2所述的搜索词获取方法，其特征在于，所述方法还包括：

设置特征库，所述特征库中存储有多个近似标签，所述近似标签与所述标签库中的标签相对应；

所述根据接收到的应用关键词获得与接收到的应用关键词匹配的标签包括: 根据接收到的应用关键词获得与接收到的应用关键词匹配的标签和 /或近似标签；

所述根据所述匹配的标签获得与所述匹配的标签对应的类别包括：根据所述匹配的标签和 I或近似标签获得对应的类别。

6、一种服务器，其特征在于，包括：标签库，所述标签库中存储有多个标签、多个类别及多个应用关键词；匹配单元，用于在接收应用关键词后，判断接收到的应用关键词是否为模糊关键词，若接收到的应用关键词是模糊关键词，则根据接收到的应用关键词获得与接收到的应用关键词匹配的标签；

7、如权利要求 6所述的服务器，其特征在于，每个所述类别包含多个所述标签，每个所述应用关键词对应至少一个标签，每个标签属于至少一个类别。

8、如权利要求 6或 7所述的服务器，其特征在于，

所述匹配单元具体用于：判断所述接收到的应用关键词的相关性分值是否低于预设的相关性分值阔值，如果是，则确定接收到的应用关键词为模糊关键词；否则，确定接收到的应用关键词不是模糊关键词。

9、如权利要求 6或 7所述的服务器，其特征在于，所述接收到的应用关键词由用户输入或来自搜索引擎输出的搜索结果。

10、如权利要求 6或 7所述的服务器，其特征在于，所述服务器还包括：特征库，所述特征库中存储有多个近似标签，所述近似标签与所述标签库中的标签相对应；

所述匹配单元接收到所述应用关键词后，从所述标签库中获得与所述接收到的应用关键词匹配的标签和 /或从所述特征库中获得与所述接收到的应用关键词匹配的近似标签，并根据匹配的所述标签和 /或近似标签获得对应的类别。

11、一种搜索词推荐系统，其特征在于，包括服务器与至少一个用户端，所述用户端用于向所述服务器发送应用关键词，以及接收所述服务器返回的推荐的搜索词并向用户展现，所述服务器进一步包括：

12、如权利要求 11所述的搜索词推荐系统，其特征在于，每个所述类别包含多个所述标签，每个所述应用关键词对应至少一个标签，每个标签属于至少一个类别。

13、如权利要求 11或 12所述的搜索词推荐系统，其特征在于，

所述匹配单元判断接收到的应用关键词是否为模糊关键词包括：判断所述则确定接收到的应用关键词为模糊关键词；否则，确定接收到的应用关键词不是模糊关键词。

14、如权利要求 11或 12所述的搜索词推荐系统，其特征在于，所述搜索词推荐系统还包括：

特征库，所述特征库中存储有多个近似标签，所述近似标签与所述标签库中的标签相对应；