一种将搜索与社交相结合的网络搜索方法及其系统
技术领域
本发明涉及一种网络搜索方法,尤其涉及一种将搜索与社交相结合的网络搜索方法,同时也涉及用于实现该方法的网络搜索系统。
背景技术
计算机和互联网技术的不断发展,极大地提高了人们获取信息的便利性。特别是随着互联网应用的日益普及,对网络中的海量信息进行准确有效的搜索日益成为人们研究的重要课题。为了便于人们快速查找到自己所需的信息,各种网络搜索系统应运而生。人们通过向网络搜索系统输入关键词,就可找到包含该关键词的网页内容。
然而,由于互联网中数据量日益庞大,通过网络搜索系统进行搜索,获得的满足条件的搜索结果也非常多,而搜索结果往往没有按照一个合理的顺序进行排列。对于这些得到的搜索结果,用户可能需要进行多次的点击查看操作,才能够找到符合自身期望搜索到的网页内容,耗时耗力。
另一方面,在现有的网络搜索系统提供搜索结果的时候,往往不能提供更多的交互性内容,更不能实现用户之间的交互探讨。用户在获得搜索结果之后,不能方便地与阅读同一搜索结果的其他用户开展即时交流活动,分享对该搜索结果的认识和心得。针对上述的需求,人们先后提出了多种技术解决方案。例如在申请号为201210030806.6的中国专利申请中,公开了一种基于社交的搜索办法及搜索系统。它把传统搜索引擎和社交技术结合,包括用户打分评论模块、交易评价模块、官网认证模块、官网问答模块、社交圈推荐模块构建成的社交技术系统,让用户参与甄别、筛选、优化搜索结果,让搜索结果更具有高效准确、社交化、个性化。其中,用户打分评论模块由用户对网站打分评论的结果来判断网站质量,决定网站在新搜索结果中的排序评级分值;尤其,通过交易评价模块(购物交易卖方为网站、买方为用户)的打分评价来反映对方的交易质量;并通过官网认证模块、官网问答模块、社交圈推荐模块,对搜索结果进行社交技术优化处理,从而有助于用户筛掉搜索结果中的欺诈网站和做出更佳的选择判断。另外,在申请号为201210332244.0的中国专利申请中,公开了一种社交网络搜索结果展示方法,包括:获取关键字,根据所述关键字获取搜索结果;获取社交属性类别;根据所述社交属性类别获取各个搜索结果对应所述社交属性类别的信息,对所述信息根据所述社交属性类别进行统计分析,获取分析结果;按照所述社交属性类别展示所述分析结果。此外,该专利申请还提供了一种社交网络搜索结果展示装置。上述社交网络搜索结果展示方法和装置可以提高用户操作的便利性。
但是,现有的社交网络搜索解决方案仍然存在很多不足。例如对于长期未使用或者已经退出网络搜索系统,但又未能及时注销的用户,不能有效地进行甄别,不能很好地满足用户边搜索边开展社交活动的需求。
发明内容
本发明所要解决的首要技术问题在于提供一种将搜索与社交相结合的网络搜索方法。
本发明所要解决的另一技术问题在于提供用于实现上述方法的网络搜索系统。
为实现上述的发明目的,本发明采用下述的技术方案:
一种将搜索与社交相结合的网络搜索方法,包括如下步骤:
S1,获取用户输入的关键字,根据关键字获得初步的搜索结果和相关用户信息;
S2,按照相似度和匹配用户的使用状态对相关用户信息进行排序,形成匹配用户序列,将匹配用户序列和搜索结果信息整合到一个页面展示给用户;
S3,根据展示给用户的页面信息,选择匹配用户进行交互探讨,对搜索结果信息进行进一步筛选,获得最终的搜索结果。
其中较优地,步骤S1中进一步包括如下步骤:
从数据库中调取其他用户在线搜索时使用的关键字以及使用信息记录,根据用户输入的关键字、使用信息记录采用匹配算法进行相似度计算,获得相似度计算结果,将相似度计算结果和匹配用户的信息作为相关用户信息。
其中较优地,所述匹配算法包括如下步骤:
S11,获取词汇相似度C1以及语义相似度C2,并计算使用者的地址相近度P1;
S12,根据C1、C2、P1的权重值α1、α2、β1的设定以及相似度计算公式:相似度=C1*α1+C2*α2+P1*β1,计算用户与其他用户的相似度。
其中较优地,所述词汇相似度分为完全相同、同义词和其他情况三种类型;
当所述用户输入的关键字和其他用户在线搜索时使用的关键字完全相同时,所述词汇相似度为100%;
当所述用户输入的关键字和其他用户在线搜索时使用的关键字为同义词时,所述词汇相似度为20%~100%之间的数值;
当所述用户输入的关键字和其他用户在线搜索时使用的关键字不属于上述两种情况时,所述词汇相似度的计算方法为:词汇相似度=(相同字符数/总字符数)*20%。
其中较优地,当用户输入的关键字和其他用户在线搜索时使用的关键字能从同义词词库中检索出来时,判断它们为同义词;否则判断它们不属于同义词。
其中较优地,所述使用者的地址相近度P1通过如下公式进行计算:
P1=用户间距离/全国用户间距离最大值
其中,用户间距离是根据用户所使用的IP地址确定用户所在的地区,利用电子地图工具进行概算确定的;全国用户间距离最大值为预先设定的固定值。
其中较优地,步骤S2中对相关用户信息进行排序时,按照匹配用户的使用状态将匹配用户分为在线用户序列和不在线用户序列,在各个序列中按照相似度的大小对匹配用户进行排序,最后将排列好的两个序列按照在线用户序列在前、不在线用户序列在后的顺序组合成匹配用户序列。
其中较优地,当与匹配用户进行交互探讨时,用户根据交互探讨情况,对匹配用户进行关注。
一种将搜索与社交相结合的网络搜索系统,用于实现上述的网络搜索方法,包括信息获取单元、匹配单元、搜索单元、整合单元和显示单元;其中,
所述信息获取单元用于获得用户输入的关键字,并将其传送到匹配单元和搜索单元;
所述匹配单元包括信息调取模块和匹配模块;
所述信息调取模块用于从数据库中调取其他用户在线搜索时使用的关键字以及使用信息记录;
所述匹配模块根据所述信息获取单元传送来的所述关键字信息以及所述信息调取模块传送来的其他用户的信息进行相似度计算,并将计算结果和匹配用户的相关信息作为相关用户信息传送到所述整合单元;
所述搜索单元根据信息获取单元传送来的所述关键字进行检索,获得搜索结果信息;
所述整合单元包括搜索单元处理模块、匹配单元处理模块和整合信息模块;
所述搜索单元处理模块用于接收所述搜索单元传送来的搜索结果信息;
所述匹配单元处理模块对于所述匹配单元传送来的相关用户信息,按照相似度和匹配用户的使用状态对其进行排序,形成匹配用户序列;
所述整合信息模块用于将所述搜索结果信息和所述匹配用户序列整合到一个页面中,发送到所述显示单元。
本发明所提供的网络搜索方法及其系统,一方面将搜索结果按照符合程度进行排序,将最符合用户需求的搜索结果优先展现出来;另一方面在为用户提供网络搜索功能的同时,通过对用户输入的关键字以及相关信息进行计算分析,促进有相同兴趣的用户之间进行匹配和交流,有利于用户之间实现信息沟通。利用本发明,能满足人们将搜索与社交相结合的使用需求,有效提高搜索服务的质量和效率。
附图说明
图1为本发明所提供的网络搜索系统的整体结构示意图;
图2为本发明中,将搜索与社交相结合进行网络搜索的流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明。
本发明首先提供了一种将搜索与社交相结合的网络搜索系统。如图1所示,它包括信息获取单元、匹配单元、搜索单元、整合单元、显示单元以及交互单元。其中,信息获取单元用于获得用户输入的关键字,并将其传送到匹配单元和搜索单元。
匹配单元包括信息调取模块和匹配模块。其中,信息调取模块从数据库中调取其他用户在线搜索时使用的关键字以及使用信息记录,包括用户所使用的IP信息、注册记录信息、搜索记录信息、使用状态信息等,并将其传送到匹配模块。匹配模块根据信息获取单元传送来的关键字信息以及信息调取模块传送来的其他用户信息进行相似度计算,并将计算结果和匹配用户的相关信息作为相关用户信息传送到整合单元。
与此同时,搜索单元根据信息获取单元传送来的用户输入的关键字信息对相关网页内容进行检索,从网络资源数据库中检索相关的搜索结果信息,并对其按照与关键字的相关程度进行排序,将最符合关键字的搜索结果排在最前面,并将初步的搜索结果信息传送到整合单元。
整合单元包括搜索单元处理模块和匹配单元处理模块,分别接收搜索单元和匹配单元传送来的相关信息。其中,搜索单元处理模块用于接收搜索单元传送来的搜索结果信息。而匹配单元处理模块对于匹配单元传送来的相关用户信息,按照相似度的大小和匹配用户的使用状态对其进行排序,形成匹配用户序列。在匹配用户序列中包含匹配用户的名称、头像信息、签名信息等。整合单元还包括整合信息模块,用于将搜索结果信息和匹配用户序列整合到一个页面中,发送到显示单元。
显示单元接收整合单元传送来的搜索结果信息和匹配用户序列,将其展示给用户。
交互单元为有相关需求的用户提供交互平台,让双方可以进行对话,对搜索结果进行交互探讨。
在上述网络搜索系统的基础上,本发明进一步提供了一种将搜索与社交相结合进行网络搜索的方法。如图2所示,该网络搜索方法具体包括如下步骤:
S1,获取用户输入的关键字,根据关键字获得初步的搜索结果和相关用户信息。
当用户进行搜索时,首先获得用户输入的关键字,根据用户输入的关键字对相关网页内容进行检索,从网络资源数据库中检索出搜索结果信息;对检索出的搜索结果信息按照与关键字的相关程度(词汇相似度或者语义相似度)进行排序,将最符合关键字的搜索结果信息排在最前面;得到初步的搜索结果。
例如在本发明的一个实施例中,该网络搜索系统是用于开展电子商务服务的购物导航系统,相应的搜索结果信息为用户感兴趣的商品信息。因此,相应的数据库中存储着商品品类及品牌的信息,由于同一分类的商品相关性较强。当判断相关商品信息与输入的关键字的相关程度时,可以通过查询数据库中存储的商品品类及品牌进行判断。
除此之外,当用户通过输入关键字进行搜索时,从数据库中调取其他用户在线搜索时使用的关键字以及使用信息记录。其中,使用信息记录包括IP信息、注册记录信息、搜索记录信息、使用状态信息等信息。根据用户输入的关键字、使用信息记录以及其他用户的相关信息采用匹配算法进行相似度计算,获得相似度计算结果;将相似度计算结果和匹配用户的相关信息合称为相关用户信息。
在本发明中,根据用户输入的关键字、使用信息记录以及其他用户的相关信息采用匹配算法进行相似度计算的过程包括如下步骤:
S11,获取词汇相似度C1以及语义相似度C2,并计算使用者的地址相近度P1。
在本发明的一个实施例中,词汇相似度C1分为完全相同、同义词和其他情况三种类型。当用户输入的关键字和其他用户在线搜索时使用的关键字完全相同时,词汇相似度C1设定为100%;当用户输入的关键字和其他用户在线搜索时使用的关键字为同义词时,词汇相似度C1为20%~100%之间的一个数值。例如,当用户输入的关键字和其他用户在线搜索时使用的关键字为同义词时,词汇相似度C1可以设定为90%。当用户输入的关键字和其他用户在线搜索时使用的关键字不属于上述两种情况时,词汇相似度C1的计算方法为:C1=(相同字符数/总字符数)*20%。其中,判断用户输入的关键字和其他用户在线搜索时使用的关键字为同义词的方法是通过查询数据库中实现存储的同义词词库进行判定的,当用户输入的关键字和其他用户在线搜索时使用的关键字能从同义词词库中检索出来时,则判断它们为同义词;当用户输入的关键字和其他用户在线搜索时使用的关键字不能从同义词词库中检索出来时,则判断它们不属于同义词。
接下来,介绍如何获得语义相似度C2。在传统的信息检索领域,已经有很多衡量文本相关性的方法,例如经典的向量空间模型(VSM),它们往往基于如下假设:不同文本之间重复的词语越多越可能相似。这一点在实际问题中并不尽然。很多时候相关程度取决于其背后的语义联系,而非表面的词语重复。因此,为了让计算机能够挖掘文本背后的语义信息,本发明优选采用基于主题模型的语义相似度计算方法,通过前期对大规模的语料和数据集进行分析计算来获得两个词之间的关系或相似性结果。所谓主题模型本质上就是在文档集合中挖掘潜在的语义结构,将文档和词语都能在挖掘的潜在语义空间中得到表示。关于基于主题模型的语义相似度计算方法,可以参阅陈杰等人的论文《领域本体的概念相似度计算》(刊载于《计算机工程与应用》2006年第33期)或者黄果等人的论文《基于领域本体的概念语义相似度计算研究》(刊载于《计算机工程与设计》2007年第10期)。它作为计算语言学领域的成熟算法,在此就不详细说明了。
在计算使用者的地址相近度P1时,可以根据用户所使用的IP地址确定用户所在的地区,利用电子地图等工具进行概算确定用户间的距离。进一步根据公式:P1=用户间距离/全国用户间距离最大值来计算使用者的地址相近度。其中,全国用户间距离最大值为预先设定的固定值,例如为5000公里等。
S12,根据相似度计算公式:相似度=C1*α1+C2*α2+P1*β1,计算其他用户与搜索用户的相似度。其中,α1、α2、β1分别为词汇相似度C1、语义相似度C2、地址相近度P1的权重值。
在本发明的一个实施例中,α1的设置范围在总权重值的10~80%之间;α2的设置范围在总权重值的10~80%之间;β1的设置范围在总权重值的0~35%之间。
S2,按照相似度和匹配用户的使用状态对相关用户信息进行排序,形成匹配用户序列,将匹配用户序列和搜索结果信息整合到一个页面展示给用户。
按照相似度的大小和匹配用户的使用状态对其进行排序,形成匹配用户序列。在本发明的一个实施例中,按照匹配用户的使用状态将匹配用户分为两个序列,其中在线用户为一个序列,不在线用户为一个序列。在各个序列中按照相似度的大小对匹配用户进行排序,然后将排列好的两个序列按照在线用户序列在前、不在线用户序列在后的顺序组合成在匹配用户序列,匹配用户序列中包含匹配用户的名称、头像信息、签名信息等。最后,将匹配用户序列和搜索结果信息整合到一个页面中展示给用户。
在本发明的一个实施例中,将搜索结果信息显示在页面的一侧,将匹配用户序列显示在页面的另一侧,根据使用者的查看需求,设定每个页面查看的匹配用户数,在线的匹配用户优先显示。如果在线的匹配用户数量超过设定的每个页面查看的匹配用户数,则分页呈现;如果在线的匹配用户数量不足设定的每个页面查看的匹配用户数,则在不足的地方补上不在线的匹配用户。不在线的匹配用户呈现与否,可以根据用户的需求进行设定。这样,对于长期未使用或者已经退出网络搜索系统,但又未能及时注销的用户,可以很好地进行甄别筛选,从而能很好地满足用户的搜索需求。
S3,根据展示给用户的页面信息,用户选择匹配用户进行交互探讨,对搜索结果信息进行进一步筛选,获得最终的搜索结果。
在本发明的一个实施例中,网络搜索系统是用于开展电子商务服务的购物导航系统。根据展示给用户的页面信息,用户可以在看到相关商品信息的同时,看到同样对该商品感兴趣的匹配用户信息。根据用户的需求以及检索到的相关商品信息决定是否与匹配用户进行进一步的交流。如果用户觉得商品难以抉择,或者感觉与匹配用户志趣相投,可以点击匹配用户的头像,发起与其的对话,当得到感兴趣的匹配用户许可后,双方可进行对话,进行进一步的交流,根据进一步的了解,对商品进行进一步的筛选,获得最终的搜索结果。这样提高了搜索服务的质量和效率。如果使用者对某个进行交互的匹配用户感兴趣,可以对其进行关注,加为好友,以便于日后进行交互探讨。
综上所述,本发明所提供的将搜索与社交相结合的搜索方法及其系统,在为用户提供搜索功能的同时,通过对用户输入的关键字以及相关信息进行计算分析,找到有相同需求或兴趣的匹配用户,并将搜索结果按照符合程度进行排序,将最符合条件的搜索结果展现出来。通过交互单元的设定,可以促进用户之间进行信息沟通,进一步加深对搜索结果的了解,查找出更加符合要求的搜索结果信息,提高搜索服务的质量和效率。搜索结果信息和匹配用户序列同时展示的方式,使用户在交互探讨时提供了交互主题,使交互更具有针对性。
以上对本发明所提供的将搜索与社交相结合的搜索方法及其系统进行了详细的说明。对本领域的技术人员而言,在不背离本发明实质精神的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。