CN105159899B

CN105159899B - 一种搜索的方法和装置

Info

Publication number: CN105159899B
Application number: CN201410262175.XA
Authority: CN
Inventors: 张友书; 张阔
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2014-06-12
Filing date: 2014-06-12
Publication date: 2020-09-29
Anticipated expiration: 2034-06-12
Also published as: CN105159899A

Abstract

本发明实施例提供了一种搜索的方法和装置，所述方法包括：当接收到第一用户提交的第一查询词串时，以所述第一查询词串进行搜索，获得匹配的网络信息；根据所述第一查询词串查找表征所述第一用户查询意图的第一查询意图信息；根据所述第一查询意图信息筛选与所述第一用户具有相同或相似查询意图的第二用户；其中，所述第二用户具有社区信息；将所述网络信息和所述第二用户对应的社区信息合成搜索结果。本发明实施例避免了第一用户重复对海量的网络信息进行繁琐的人工过滤，减少了第一用户时间和精力的耗费，也减少了用户设备和网站的系统资源消耗，也减少了网络带宽的占用，大大提高了信息获取的效率、质量和容量。

Description

一种搜索的方法和装置

技术领域

本发明涉及搜索的技术领域，特别是涉及一种搜索的方法和一种搜索的装置。

背景技术

随着网络的迅速发展，网络信息急剧增加。用户为了在海量的网络信息中寻找所需的网络信息，通常使用搜索引擎进行搜索。

搜索引擎指自动从因特网搜集信息，经过一定整理以后，提供给用户进行查询的系统。网络信息浩瀚万千，而且毫无秩序，所有的网络信息像汪洋上的一个个小岛，网页链接是这些小岛之间纵横交错的桥梁，而搜索引擎，则为用户绘制一幅一目了然的信息地图，供用户随时查阅。

但是，网络信息增长的速度和人们获取所需信息能力之间的矛盾越来越突出，过量的网络信息使得用户在搜索网络信息的时候要进行繁琐的人工过滤，耗费大量时间和精力，网络信息的搜索效率很低。

发明内容

本发明实施例所要解决的技术问题是提供一种搜索的方法，用以较少用户时间和精力的耗费，提高网络信息的搜索效率。

相应的，本发明实施例还提供了一种搜索的装置，用以保证上述方法的实现及应用。

为了解决上述问题，本发明实施例公开了一种搜索的方法，包括：

当接收到第一用户提交的第一查询词串时，以所述第一查询词串进行搜索，获得匹配的网络信息；

根据所述第一查询词串查找表征所述第一用户查询意图的第一查询意图信息；

根据所述第一查询意图信息筛选与所述第一用户具有相同或相似查询意图的第二用户；其中，所述第二用户具有社区信息；

将所述网络信息和所述第二用户对应的社区信息合成搜索结果。

优选地，所述根据所述第一查询词串查找表征所述第一用户查询意图的第一查询意图信息的步骤包括：

结合所述第一查询词串与所述网络信息查找表征所述第一用户查询意图的第一查询意图信息。

优选地，所述根据所述第一查询意图筛选与所述第一用户具有相同或相似查询意图的第二用户的步骤包括：

获取表征所述第二用户查询意图的第二查询意图信息；

计算所述第一查询意图信息与所述第二查询意图信息的相似度；

当所述相似度大于预设的相似度阈值时，判断所述第一用户与所述第二用户具有相同或相似的查询意图。

优选地，所述第一查询意图信息包括第一特征向量，所述第一特征向量根据所述第一查询词串进行确定；

所述第二查询意图信息包括第二特征向量，所述第二特征向量根据所述第二查询词串进行确定；

其中，所述第二查询词串为所述第二用户在先提交的查询词串。

优选地，所述第一特征向量包括以下至少一种：

第一查询词串、与第一查询词串的分词关联的特征向量、与第一查询词串匹配的网络信息关联的特征向量；

所述第二特征向量包括以下至少一种：

第二查询词串、与第二查询词串的分词关联的特征向量、与第二查询词串匹配的网络信息关联的特征向量。

优选地，所述将所述网络信息和所述第二用户对应的社区信息合成搜索结果的步骤包括：

计算所述第一用户与所述第二用户的关联密切度；

按照所述关联密切度对所述第二用户对应的社区信息进行排序；

将所述网络信息和排序后的第二用户对应的社区信息合成搜索结果。

优选地，所述计算所述第一用户与所述第二用户的关联密切度的步骤包括：

对所述第一查询意图信息与所述第二查询意图信息的相似度，和/或，所述第一用户与所述第二用户之间的关联信息，和/或，所述第二用户对所述第二查询意图的历史操作信息配置对应的权重；

对配置权重之后的所述第一查询意图信息与所述第二查询意图信息的相似度，和/或，所述第一用户与所述第二用户之间的关联信息，和/或，所述第二用户对所述第二查询意图的历史操作信息进行求和计算，获得所述第一用户与所述第二用户的关联密切度。

优选地，所述第一用户与所述第二用户之间的关联信息包括以下至少一种：

预设时间段内的平均联系次数、预设时间段内的平均联系时长、共同好友的数量、居住位置；

所述第二用户对所述第二查询意图的历史操作信息包括以下至少一种：

所述第二查询意图对应的搜索次数、与所述第二查询意图匹配的网络信息的历史点击次数、所述第二查询意图对应的网络信息的浏览时长、所述第二查询意图对应的搜索持续天数。

优选地，所述第一用户与所述第二用户之间具有社区好友关系。

本发明实施例还公开了一种搜索的装置，包括：

网络信息搜索模块，用于在接收到第一用户提交的第一查询词串时，以所述第一查询词串进行搜索，获得匹配的网络信息；

查询意图信息查找模块，用于根据所述第一查询词串查找表征所述第一用户查询意图的第一查询意图信息；

用户筛选模块，用于根据所述第一查询意图筛选信息筛选与所述第一用户具有相同或相似查询意图的第二用户；其中，所述第二用户具有社区信息；

搜索结果合成模块，用于将所述网络信息和所述第二用户对应的社区信息合成搜索结果。

优选地，所述查询意图信息查找模块包括：

信息结合查找子模块，用于结合所述第一查询词串与所述网络信息查找表征所述第一用户查询意图的第一查询意图信息。

优选地，所述用户筛选模块包括：

查询意图信息获取子模块，用于获取表征所述第二用户查询意图的第二查询意图信息；

查询意图信息相似度计算子模块，用于计算所述第一查询意图信息与所述第二查询意图信息的相似度；

判断子模块，用于在所述相似度大于预设的相似度阈值时，判断所述第一用户与所述第二用户具有相同或相似的查询意图。

优选地，所述搜索结果合成模块包括：

关联密切度计算子模块，用于计算所述第一用户与所述第二用户的关联密切度；

社区信息排序子模块，用于按照所述关联密切度对所述第二用户对应的社区信息进行排序；

合成子模块，用于将所述网络信息和排序后的第二用户对应的社区信息合成搜索结果。

优选地，所述关联密切度计算子模块包括：

权重配置子模块，用于对所述第一查询意图信息与所述第二查询意图信息的相似度，和/或，所述第一用户与所述第二用户之间的关联信息，和/或，所述第二用户对所述第二查询意图的历史操作信息配置对应的权重；

求和计算子模块，用于对配置权重之后的所述第一查询意图信息与所述第二查询意图信息的相似度，和/或，所述第一用户与所述第二用户之间的关联信息，和/或，所述第二用户对所述第二查询意图的历史操作信息进行求和计算，获得所述第一用户与所述第二用户的关联密切度。

与现有技术相比，本发明实施例包括以下优点：

本发明实施例中以第一用户提交的第一查询词串进行搜索，获得匹配的网络信息，以及，根据表征第一用户查询意图的第一查询意图信息查找与第一用户具有相同或相似查询意图的第二用户，并将网络信息和第二用户的社区信息合成搜索结果，使得在第一用户需求明确时，通过分析搜索日志来筛选用户的社区好友中，与用户有相同需求的第二用户，使第一用户可以基于社区信息与筛选到的第二用户就相同的需求进行互动交流，则第一用户可以直接获得第二用户在先整理过的信息，第二用户人工整理的信息比机械返回的信息更加有效，避免了第一用户重复对海量的网络信息进行繁琐的人工过滤，减少了第一用户时间和精力的耗费，也减少了用户设备和网站的系统资源消耗，也减少了网络带宽的占用，大大提高了信息获取的效率、质量和容量。

附图说明

图1是本发明的一种搜索的方法实施例的步骤流程图；

图2是本发明的一种搜索的装置实施例的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图1，示出了本发明的一种搜索的方法实施例的步骤流程图，具体可以包括如下步骤：

步骤101，当接收到第一用户提交的第一查询词串时，以所述第一查询词串进行搜索，获得匹配的网络信息；

应用本发明实施例，第一用户可以在第一客户端登录，则第一用户可以通过第一客户端提交第一查询词串，请求搜索与该第一查询词串匹配的网络信息。

本发明实施例中，当接收到第一用户提交的第一查询词串时，则可以根据该第一查询词串在索引库中快速检出网络信息，进行网络信息与查询的相关度评价，对将要输出的结果进行排序。

以搜索引擎为例进行说明，搜索引擎的搜索流程分为二个部分，一是前端用户请求过程，二是后端制作数据过程。

一、前端用户请求过程：

1.接收请求：接收用户在搜索引擎输入的查询词串；

2.查询词分析：对查询词串进行分词处理；

3.检索：根据分词结果，从预先制作的倒排索引中，查找与分词结果相关的候选的网络信息；

4.排序：针对候选的网络信息，根据内容相关性、时效性等维度进行排序；

5.展现：将排序后的网页在搜索引擎页面展现出来。

二、后端制作数据过程：

1.网页抓取：采用爬虫技术，通过网页间的链接关系，抓取互联网的网络信息并保存。

2.索引制作：对已抓取保存的网络信息进行分析，例如对网页标题和页面文本进行分词处理，根据分词结果制作倒排索引，供前端用户请求过程使用。

步骤102，根据所述第一查询词串查找表征所述第一用户查询意图的第一查询意图信息；

用户所发出的每个搜索请求背后都可能隐含着潜在的查询意图，第一查询意图信息可以为标识第一用户查询意图的信息。

例如，当用户请求搜索“海淀妇幼”，该用户的查询意图可以为医疗类查询。

在本发明的一种优选实施例中，步骤102可以包括如下子步骤：

子步骤S10，结合所述第一查询词串与所述网络信息查找表征所述第一用户查询意图的第一查询意图信息。

一般情况下，第一查询词串本身所包含的信息量较少，而与第一查询词串匹配的网络信息所包含的信息量较大。进一步地，为了提高查询意图的识别精度，本发明实施例中，可以结合与所述第一查询词串匹配的网络信息，即分析第一查询词串得到的搜索结果得到的信息，根据第一查询词串和与所述第一查询词串匹配的网络信息查找表征所述第一用户查询意图的第一查询意图信息。

步骤103，根据所述第一查询意图筛选信息筛选与所述第一用户具有相同或相似查询意图的第二用户；

本发明实施中，可以根据查询词串查找出第一用户背后的查询意图，然后针对不同的搜索意图，匹配符合第一用户的查询意图的第二用户。

在具体实现中，所述第一用户与所述第二用户之间可以具有好友关系，则本发明实施例中可以关联社交账户，例如即时通讯工具用户、各类型的网站(如论坛、贴吧、门户网站等等)注册用户等等，关联社交账户可以得到第一用户的好友关系，在第一用户的好友用户中查找匹配第二用户。

需要说明的是，好友关系可以包括一级或多级好友关系，例如，一级好友关系的用户可以为当前用户的好友用户，二级好友用户可以为当前用户的好友用户各自对应的好友用户等等，本发明实施例对此不加以限制。

当然，所述第一用户与所述第二用户之间可以具有非好友关系，即第二用户相对于第一用户而言可以为陌生用户，则本发明实施例中可以在全局范围内查找匹配的第二用户。

其中，所述第二用户可以具有社区信息。而社区可以是若干社会群体或社会组织聚集在某一个领域里所形成的一个生活上相互关联的大集体，例如论坛、微博、贴吧、门户网站、即时通讯系统等等，即社区信息可以包括用户头像、用户名称、用户ID、通讯地址等等。

子步骤S11，获取表征所述第二用户查询意图的第二查询意图信息；

第二查询意图信息可以为标识第二用户查询意图的信息。

在本发明实施例的一种优选示例中，所述第一查询意图信息可以包括第一特征向量，所述第二查询意图信息可以包括第二特征向量；

其中，第一特征向量可以为标识第一用户查询意图的向量信息，所述第一特征向量可以根据所述第一查询词串进行确定，第二特征向量可以为标识第二用户查询意图的向量信息，所述第二特征向量可以根据所述第二查询词串进行确定；所述第二查询词串可以为所述第二用户在先提交的查询词串。

在本示例中，可以通过对查询词串、搜索结果和搜索日志进行分析，查找代表查询词串的查询意图的特征，计算得到特征值，从而将查询词串表示为特征向量。

查询词串的查询意图相关的特征向量可以分为三大类，第一类可以为查询词串本身的特征向量，第二类可以为与查询词串的分词关联的特征向量，第三类可以为与查询词串匹配的网络信息关联的特征向量，这些特征向量都可以用于表示查询词串的查询意图。

则在具体实现中，所述第一特征向量可以包括以下至少一种：

所述第二特征向量可以包括以下至少一种：

在本发明实施的一种优选示例中，所述与第一查询词串的分词关联的特征向量可以包括以下至少一种：

第一查询词串的同义词串、第一查询词串的分词、第一查询词串的分词的词性、第一查询词串的分词的同义词、第一查询词串的分词的重要度；

所述与第一查询词串匹配的网络信息关联的特征向量可以包括以下至少一种：

与第一查询词串匹配的网络信息的标题、与第一查询词串匹配的网络信息的网页标识、与第一查询词串匹配的网络信息的历史点击信息、与第一查询词串关联的其他查询词串；

所述与第二查询词串的分词关联的特征向量可以包括以下至少一种：

第二查询词串的同义词串、第二查询词串的分词、第二查询词串的分词的词性、第二查询词串的分词的同义词、第二查询词串的分词的重要度；

所述与第二查询词串匹配的网络信息关联的特征向量可以包括以下至少一种：

与第二查询词串匹配的网络信息的标题、与第二查询词串匹配的网络信息的网页标识、与第二查询词串匹配的网络信息的历史点击信息、与第二查询词串关联的其他查询词串。

第一/第二特征向量的示例可以如下：

1、查询词串本身；

例如，用户提交的查询词串“海淀妇幼”本身。

2、查询词串的同义词串；

本示例中，可以在预先制作好的同义词字典中找到查询词串的同义词串。例如，“海淀妇幼保健院”和“海淀妇幼”是同义词，“新天龙八部”和“天龙八部钟汉良版”是同义词(这类同义词会随着实际变化，总是和最新一版的天龙八部是同义词)。

3、查询词串的分词term；

本示例中，可以对查询词进行分词，获得分词后的term。例如，对查询词串“海淀妇幼建档”分词后的term有二个[海淀妇幼，建档]。

4、查询词串的分词term的词性；

本示例中，可以对分词term进行词性分析，获得分词term的词性。例如，分词term[海淀妇幼，建档]对应的词性为[名词，动词]。

5、查询词串的分词term的同义词；

本示例中，可以在预先制作的同义词字典中查找分词term的同义词。例如，分词term[海淀妇幼，建档]的同义词为[海淀妇幼保健院，建档]。

6、查询词串的分词term的重要度；

本示例中，可以通过统计搜索日志，获得每个分词term的TF(Term Frequency，词频)和IDF(Inverse Document Frequency，反文档频率)。TF-IDF是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。则本示例中可以通过TF-IDF来表示每个分词term的重要度。例如，分词term[海淀妇幼，官网]中，“海淀妇幼”的TF-IDF值要比“官网”的TF-IDF值高，则“海淀妇幼”比“官网”重要度高，包含更多的信息量。

7、与查询词串匹配的网络信息的标题；

本示例中，网络信息的标题可以是指与查询词串对应的，搜索引擎返回的前N(N为正整数，例如10)条搜索结果的标题，可以用于定位查询词串相关的文本和关键词。例如，搜索“淘宝”，返回的搜索结果前三条的标题分别为“淘宝网-淘！我喜欢”，“随便逛逛-淘宝网”和“淘宝”。

8、与查询词串匹配的网络信息的网页标识；

本示例中，网页标识可以是能够代表一个唯一确定的网页的信息，例如统一资源标识符(Uniform Resource Identifier，URI)，统一资源标识符又具体可以包括统一资源定位符(Uniform Resource Locator，URL)，或者统一资源名称(Uniform Resource Name，URN)等等。具体可以为搜索结果前M(M为正整数，例如10)条网络信息的URL，可以用于定位查询词串相关的网址和网站。例如，搜索“淘宝”，搜索结果的前三条URL分别为“http://www.***.com/”，“http://guang.***.com/”和“http://shuo.***.com/”。

9、与查询词串匹配的网络信息的历史点击信息；

本示例中，历史点击信息可以为搜索该查询词串的用户，在搜索结果中的点击情况的统计。通过用户行为来衡量哪些网络信息更重要、与查询词串更相关。例如，用户搜索“淘宝”10000次，前三条URL的点击为表1所示。

表1、历史点击信息表

搜索结果前三条URL	点击次数	比例
			http://www.***.com/	8000	80％
http://guang.***.com/	1000	10％
			http://shuo.***.com/	1000	10％

由表1可以表明，第一条网络信息的URL与查询词串更相关。

10、与查询词串关联的其他查询词串；

本示例中，可以搜索提交该查询词串的用户还搜索了哪些其他查询词串，可以用于表示查询词串相关的一些概念。例如，搜索“十八大”的用户，还搜索了“两会”，“党的十八精神”等。

当然，上述第一/第二特征向量只是作为示例，在实施本发明实施例时，可以根据实际情况设置其他第一/第二特征向量，本发明实施例对此不加以限制。另外，除了上述第一/第二特征向量外，本领域技术人员还可以根据实际需要采用其它第一/第二特征向量，本发明实施例对此也不加以限制。

子步骤S12，计算所述第一查询意图信息与所述第二查询意图信息的相似度；

在具体实现中，可以将各查询词串根据查询意图的相似性进行聚类。

在本发明实施例的一种优选示例中，子步骤S12进一步可以包括如下子步骤：

子步骤S121，计算所述第一特征向量与所述第二特征向量之间的相似度。

在本示例中，对于由查询词串确定的特征向量，可以使用聚类算法(例如层次聚类算法/kmeans算法等)计算相似度，再根据相似度将查询词串进行类别划分。

例如，表2中的第一查询词串“海淀妇幼建档”和第二查询词串“海淀妇幼建档流程”对应的第一特征向量和第二特征向量，相同的部分有：

1、查询词串的分词term有二个重要度高的分词term相同，分别为“海淀妇幼”和“建档”；

2、与查询词串匹配的网络信息的点击日志中，第1条历史点击信息和第2条历史点击信息相同；

3、“海淀妇幼建档流程”中与查询词串关联的其他查询词串中包含“海淀妇幼建档”。

表2、特征向量对比表

在使用聚类算法的聚类过程中，会对这些相同部分进行量化并计算得到第一特征向量和第二特征向量的相似度。

子步骤S13，当所述相似度大于预设的相似度阈值时，判断所述第一用户与所述第二用户具有相同或相似的查询意图。

在具体实现中，当相似度超过预设相似度阈值时，则第一查询词串和第二查询词串可以聚为一类，即第一用户与第二用户具有相同或相似的查询意图。

第一特征向量和第二特征向量越相似，第一查询词串和第二查询词串就越有可能是在聚类过程中被聚为一类，第一用户和第二用户的查询意图就越相似，甚至相同。

例如，第一查询词串“海淀妇幼建档”和第二查询词串“海淀妇幼建档流程”可以聚为一类，第一查询词串“贷款申请”和第二查询词串“申请贷款流程”可以聚为一类。

在具体实现中，可以在用户进行查询之后，保存用户及其查询意图、查询词串/特征向量及其查询意图的对应关系，以方便后续查找与第一用户具有相同或相似查询意图的第二用户。

例如，该对应关系可以按照如表3所示的格式保存。

表3、用户-查询意图、查询词串/特征向量-查询意图对应列表

在查找与第一用户具有相同或相似查询意图的第二用户时，根据保存的用户-查询意图、查询词串/特征向量-查询意图对应列表，和第一用户的第一特征向量，计算得到与第一用户查询意图相同或相似的第二用户。

具体计算步骤如下：

1、确定第一用户的第一特征向量A；

2、采用A与用户-查询意图、查询词串/特征向量-查询意图对应列表中的特征向量A1，A2…，An(n为正整数)计算相似度，找到相似度最高的特征相向量Ai(i为正整数)对应的查询意图i；

3、根据第2步得到的查询意图i，在用户-查询意图、查询词串/特征向量-查询意图对应列表中，找到查询意图i的第二用户。

例如，在表3所示的用户-查询意图、查询词串/特征向量-查询意图对应列表中，对于搜索“建档海淀妇幼”第一用户，找到相似度最高的第二特征向量对应的查询词串为“海淀妇幼建档”，对应的查询意图为查询意图1，查询意图1对应的第二用户有用户1、用户2和用户3。

步骤104，将所述网络信息和所述第二用户的社区信息合成搜索结果。

本发明实施例中，可以以网络信息和第二用户对应的社区信息作为最终的搜索结果。

在本发明的一种优选实施例中，步骤104可以包括如下子步骤：

子步骤S21，计算所述第一用户与所述第二用户的关联密切度；

本发明实施例中，影响第一用户与第二用户关联密切度的因素可以包括三个部分，第一部分是查询意图的相似度，第二部分是第一用户与第二用户的熟悉程度，第三部分是第二用户对查询意图的熟悉程度。

在本发明实施例的一种优选示例中，子步骤S21进一步可以包括如下子步骤：

子步骤S211，对所述第一查询意图信息与所述第二查询意图信息的相似度，和/或，所述第一用户与所述第二用户之间的关联信息，和/或，所述第二用户对所述第二查询意图的历史操作信息配置对应的权重；

子步骤S212，对配置权重之后的所述第一查询意图信息与所述第二查询意图信息的相似度，和/或，所述第一用户与所述第二用户之间的关联信息，和/或，所述第二用户对所述第二查询意图的历史操作信息进行求和计算，获得所述第一用户与所述第二用户的关联密切度。

本示例中，可以通过对历史数据和搜索日志分析，所述第二查询意图信息的相似度，和/或，所述第一用户与所述第二用户之间的关联信息，和/或，所述第二用户对所述第二查询意图的历史操作信息中每个因素的数值，然后根据实际需求和经验配置权重，例如重要度越高，其权重则可以越大，最后通过对各种因素加权计算，得到关联密切度。

在实际应用中，第一查询意图信息与第二查询意图信息的相似度可以在步骤102中计算得到。查询词串越相似，查询意图则越相似。

例如，第一用户搜索“海淀妇幼建档”，第二用户A搜索过“海淀妇幼建档流程”，第二用户B搜索过“海淀妇幼”，那么第二用户A比第二用户B的查询意图更接近第一用户，则第一用户与第二用户A的关联密切度比第二用户B的关联密切度更大。

在具体实现中，所述第一用户与所述第二用户之间的关联信息可以包括以下至少一种：

预设时间段内的平均联系次数、预设时间段内的平均联系时长、共同好友的数量、居住位置。

在本示例中，关联信息可以标识第一用户和第二用户的熟悉程度，越经常联系的第二用户，其熟悉程度越高，则关联密切度则越高。

所述第二用户对所述第二查询意图的历史操作信息可以包括以下至少一种：

在本示例中，历史操作信息可以标识第二用户对该查询意图的理解度，对该查询意图花费时间越多、越熟悉的第二用户，其理解对越高，则关联密切度则越高。

对于第二查询意图对应的搜索次数，可以在如表3所示的用户-查询意图、查询词串/特征向量-查询意图对应列表查找到，例如对于查询意图1对应的搜索次数的排序可以为用户2>用户3>用户1。

对于与所述第二查询意图匹配的网络信息的历史点击次数，可以从搜索日志中可以得到第二用户对第二查询词串的点击次数，点击次数越多，则可以说明浏览的网页数量、内容越多，对第二查询意图的熟悉程度越高。

对于第二查询意图对应的网络信息的浏览时长，可以从搜索日志中统计得到第二用户浏览第二查询词串相关网页的时间量，浏览时间越长，则对第二查询意图的熟悉程度越高。

对于第二查询意图对应的搜索持续天数，可以从搜索日志中统计得到第二用户查询同一查询意图的持续天数。天数越多、持续时间越长，则可以说明第二用户对第二查询意图越熟悉。例如，第二用户A持续一个月搜索“日本旅游”，第二用户B持续三天搜索“日本旅游”，则可以认为第二用户A比第二用户B对“日本旅游”这个查询意图更熟悉一点。

例如第一用户搜索“海淀妇幼建档流程”，具有相同或相似查询意图的第二用户有三位，分别为第二用户A、第二用户B、第二用户C，影响关联密切度的因素如表4所示。

表4、关联密切度对比表

其中，第二用户A和第二用户C相比，和第一用户联系频繁一样，但更熟悉该查询意图。第二用户C和第二用户B相比，与第一用户联系更频繁，对该查询意图更熟悉。

子步骤S22，按照所述关联密切度对所述第二用户对应的社区信息进行排序；

在本示例中，可以按照关联密切度从高到低进行排序，即顺序排序；当然，本示例中也可以按照关联密切度从低到高进行排序，即倒序排序，本发明实施例对此不加以限制。

例如，表4所示的关联密切度：155>135>117.2，可以得到第二用户的排序顺序为：第二用户A>第二用户C>第二用户B。

子步骤S23，将所述网络信息和排序后的第二用户对应的社区信息合成搜索结果。

在搜索结果合成完成后，则可以在客户端中将排序后的第二用户的社区信息连同网络信息展现给第一用户，如将各第二用户的头像在第一查询词串对应的网络信息的右侧展现，供第一用户进行沟通交流。

应用本发明实施例，可以在搜索结果的合成时，对第二用户的社区信息构造与第二用户进行通讯的通讯软件的入口对象，第一用户可以通过鼠标点击等方式触发该入口对象，直接与第二用户进行通讯。

当然，第一用户在获得第二用户的社区信息后，也可以采用其他途径与第二用户进行通讯。

例如，若第二用户的社区信息中包括邮件地址，则第一用户可以获得该第二用户的outlook(一个用于收、发、写、管理电子邮件的应用程序)入口，向该邮件地址发送邮件。

又例如，若第二用户的社区信息中包括用户名称或用户ID，则第一用户可以通过对应的即时通讯工具、各类型的网站(如论坛、贴吧、门户网站等等)等查找到第二用户进行通讯。

在其他实施例中，用户可在移动客户端进行搜索，通过无线的方式提交第一查询词串，查找与当前用户具有相同或相似查询意图的第二用户，并将网络信息和第二用户的社区信息合成搜索结果，使得用户需求明确时，通过分析搜索日志来筛选用户的社区好友中，与用户有相同需求的第二用户，并根据第二用户合成无线搜索结果返回至移动客户端，用户直接在移动客户端上调用的对应的即时通信软件与选定的第二用户进行沟通。

传统的搜索引擎只能搜索网络信息，用户使用搜索引擎时，仅是单纯地被动获得网页结果，不能查找当前用户相关的好友用户，更加并不能就搜索的需求进行互动交流，获取信息的效率和容量很低。而当前用户在微博、论坛等社区网站中输入查询词串，社区网站可以返回与查询词串相关的用户和微博/帖子，但是社区网站搜索返回的用户是将查询词串与社区信息(主要是用户名)匹配得到，并没有对用户需求进行分析，更加无法检索出有同需求的用户。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

参照图2，示出了本发明一种搜索的装置实施例的结构框图，具体可以包括如下模块：

网络信息搜索模块201，用于在接收到第一用户提交的第一查询词串时，以所述第一查询词串进行搜索，获得匹配的网络信息；

查询意图信息查找模块202，用于根据所述第一查询词串查找表征所述第一用户查询意图的第一查询意图信息；

用户筛选模块203，用于根据所述第一查询意图筛选信息筛选与所述第一用户具有相同或相似查询意图的第二用户；其中，所述第二用户具有社区信息；

搜索结果合成模块204，用于将所述网络信息和所述第二用户对应的社区信息合成搜索结果。

在本发明的一种优选实施例中，所述查询意图信息查找模块202可以包括如下子模块：

在本发明的一种优选实施例中，所述用户筛选模块203可以包括如下子模块：

在本发明的一种优选实施例中，所述第一查询意图信息可以包括第一特征向量，所述第一特征向量根据所述第一查询词串进行确定；

所述第二查询意图信息可以包括第二特征向量，所述第二特征向量根据所述第二查询词串进行确定；

在本发明的一种优选实施例中，所述查询意图信息相似度计算子模块可以包括如下子模块：

特征向量相似度计算子模块，用于计算所述第一特征向量与所述第二特征向量之间的相似度。

在本发明的一种优选实施例中，所述第一特征向量可以包括以下至少一种：

所述第二特征向量可以包括以下至少一种：

在本发明实施例的一种优选示例中，所述与第一查询词串的分词关联的特征向量可以包括以下至少一种：

在本发明的一种优选实施例中，所述搜索结果合成模块204可以包括如下子模块：

在本发明的一种优选实施例中，所述关联密切度计算子模块可以包括如下子模块：

在本发明实施例的一种优选示例中，所述第一用户与所述第二用户之间的关联信息可以包括以下至少一种：

在本发明的一种优选实施例中，所述第一用户与所述第二用户之间可以具有好友关系。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种搜索的方法和一种搜索的装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种搜索的方法，其特征在于，包括：

将所述网络信息和所述第二用户对应的社区信息合成搜索结果，包括：针对所述第二用户对应的社区信息、构造通讯软件的入口对象，以使所述第一用户通过触发所述入口对象、与所述第二用户进行通讯。

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一查询词串查找表征所述第一用户查询意图的第一查询意图信息的步骤包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述第一查询意图筛选与所述第一用户具有相同或相似查询意图的第二用户的步骤包括：

获取表征所述第二用户查询意图的第二查询意图信息；

4.根据权利要求3所述的方法，其特征在于，所述第一查询意图信息包括第一特征向量，所述第一特征向量根据所述第一查询词串进行确定；

所述第二查询意图信息包括第二特征向量，所述第二特征向量根据第二查询词串进行确定；

5.根据权利要求4所述的方法，其特征在于，所述第一特征向量包括以下至少一种：

所述第二特征向量包括以下至少一种：

6.根据权利要求1所述的方法，其特征在于，所述将所述网络信息和所述第二用户对应的社区信息合成搜索结果的步骤包括：

计算所述第一用户与所述第二用户的关联密切度；

7.根据权利要求6所述的方法，其特征在于，所述计算所述第一用户与所述第二用户的关联密切度的步骤包括：

对所述第一查询意图信息与第二查询意图信息的相似度，和/或，所述第一用户与所述第二用户之间的关联信息，和/或，所述第二用户对所述第二查询意图的历史操作信息配置对应的权重；所述第二查询意图信息表征第二用户查询意图；

8.根据权利要求7所述的方法，其特征在于，所述第一用户与所述第二用户之间的关联信息包括以下至少一种：

9.根据权利要求1或2或3或6或7或8所述的方法，其特征在于，所述第一用户与所述第二用户之间具有社区好友关系。

10.一种搜索的装置，其特征在于，包括：

用户筛选模块，用于根据所述第一查询意图信息筛选与所述第一用户具有相同或相似查询意图的第二用户；其中，所述第二用户具有社区信息；

搜索结果合成模块，用于将所述网络信息和所述第二用户对应的社区信息合成搜索结果，包括：针对所述第二用户对应的社区信息、构造通讯软件的入口对象，以使所述第一用户通过触发所述入口对象、与所述第二用户进行通讯。

11.根据权利要求10所述的装置，其特征在于，所述查询意图信息查找模块包括：

12.根据权利要求10所述的装置，其特征在于，所述用户筛选模块包括：

13.根据权利要求10所述的装置，其特征在于，所述搜索结果合成模块包括：

14.根据权利要求13所述的装置，其特征在于，所述关联密切度计算子模块包括：

权重配置子模块，用于对所述第一查询意图信息与第二查询意图信息的相似度，和/或，所述第一用户与所述第二用户之间的关联信息，和/或，所述第二用户对所述第二查询意图的历史操作信息配置对应的权重；所述第二查询意图信息表征第二用户查询意图；