CN103034672A - 社会化搜索系统及搜索方法 - Google Patents

社会化搜索系统及搜索方法 Download PDF

Info

Publication number
CN103034672A
CN103034672A CN2012100820232A CN201210082023A CN103034672A CN 103034672 A CN103034672 A CN 103034672A CN 2012100820232 A CN2012100820232 A CN 2012100820232A CN 201210082023 A CN201210082023 A CN 201210082023A CN 103034672 A CN103034672 A CN 103034672A
Authority
CN
China
Prior art keywords
topic
search
socialization
community
subscriber
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100820232A
Other languages
English (en)
Inventor
刘骏
孙峥
盛佳
李大海
王东
陈利人
曲径
项锟
安兴华
马俊
寇黎钦
马剑
张晓鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YUNRANG (BEIJING) INFORMATION TECHNOLOGY Co Ltd
Original Assignee
YUNRANG (BEIJING) INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YUNRANG (BEIJING) INFORMATION TECHNOLOGY Co Ltd filed Critical YUNRANG (BEIJING) INFORMATION TECHNOLOGY Co Ltd
Priority to CN2012100820232A priority Critical patent/CN103034672A/zh
Publication of CN103034672A publication Critical patent/CN103034672A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明是有关一种社会化搜索系统及搜索方法。该社会化搜索系统,用于搜索至少一个网络社区的多个话题,所述话题包括话题基本信息、话题关联信息、创建该话题的创建成员信息和与该话题关联的关联成员信息,其包括:搜索接口,接收搜索用户提出的搜索请求,并判断该搜索用户是否为所述网络社区的社区成员;以及话题搜索系统,从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题的链接展现给所述搜索用户。该社会化搜索方法,包括以下步骤:接收搜索用户提出的搜索请求;以及从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题链接展现给所述搜索用户。本发明的搜索结果包含社会化信息,更贴近搜索用户的需求。

Description

社会化搜索系统及搜索方法
技术领域
本发明涉及网络搜索技术,特别是涉及一种社会化搜索系统及搜索方法。
背景技术
现有的搜索引擎在互联网上搜集信息时主要是通过网页之间的静态链接关系来收集数据。当现有的搜索引擎返回搜索结果时,搜索结果通常包括指向不同网站的网页的链接,用户可以选择一个指向特定网站的链接来尝试找到感兴趣的内容。现有的搜索结果通常针对同样的搜索请求返回相同的搜索结果。随着互联网技术的高速发展,在线网络社区也越来越普及成熟。用户越来越关注和重视与自身有关的搜索结果,例如朋友发表的文章、朋友针对某产品发表的评论等等。如何为搜索用户提供更为贴近用户自身的搜索结果成为热门的研究课题。
发明内容
有鉴于上述现有技术所存在的缺陷,本发明的目的在于,提供一种社会化搜索系统及搜索方法,使其所返回的搜索结果包含社会化信息。
为了实现上述目的,依据本发明提出的一种社会化搜索系统,所述社会化搜索系统用于搜索至少一个网络社区的多个话题,所述话题包括话题基本信息、话题关联信息、创建该话题的创建成员信息和与该话题关联的关联成员信息,所述搜索系统包括:搜索接口,接收搜索用户提出的搜索请求,并判断该搜索用户是否为所述网络社区的社区成员;以及话题搜索系统,从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题的链接展现给所述搜索用户。本发明的社会化搜索系统的搜索结果中包含了网络社区的话题,因此能够提现社会化信息。
本发明还可采用以下技术措施进一步实现。
前述的社会化搜索系统,其还包括网页搜索系统,接收所述搜索请求并将网页搜索结果展现给搜索用户。本发明的社会化搜索系统的搜索结果不仅包含话题还包括网页,因此更为贴近用户的需求。
前述的社会化搜索系统,其还包括搜索整合模块,所述搜索整合模块将话题搜索结果和网页搜索结果单独和/或整合展现给所述搜索用户。本发明的搜索结果展现方式多样,便于搜索用户浏览。
前述的社会化搜索系统,其中所述的搜索整合模块根据排名要素对话题搜索结果和/或网页搜索结果进行排名,所述排名要素选自下述一种或多种要素:所述搜索请求的社会化意图;所述搜索用户是登录该网络社区的成员时,该社区成员的社会化活跃度;所述搜索用户是登录该网络社区的成员时,话题与该社区成员的关联度。
前述的社会化搜索系统,其中所述的搜索整合模块收集社区成员的点击、浏览、创建话题的行为,调整所述社区成员的社会化活跃度。
前述的社会化搜索系统,其中所述的话题搜索系统包括:话题索引数据库,存储所述网络社区话题的话题索引;话题搜索模块,接收搜索用户的搜索请求,从该话题索引数据库中搜索与搜索请求相关联的话题索引;以及话题排序模块,将所述话题搜索模块搜索到的话题索引所指向的话题进行排序。
前述的社会化搜索系统,其中所述的话题是由网络社区成员创建和/或根据热点的热度创建;所述的话题索引数据库根据网络社区的话题实时更新话题索引。
前述的社会化搜索系统,其中所述的话题索引数据库包括话题名称索引库及话题相关内容索引库;所述话题名称索引库的基本搜索单元是话题名称;所述话题相关内容索引库的基本搜索单元是和话题关联信息。
前述的社会化搜索系统,其中所述话题排序是根据下述一种或多种因素排序:话题与搜索请求匹配程度;关注话题的成员总数;话题相关条目的总条目数;与搜索请求匹配的话题相关条目的条目数;当搜索用户是社区成员时,话题关联成员与该搜索用户的匹配程度;当搜索用户是社区成员时,与搜索请求匹配的话题相关条目中搜索用户的朋友参与的数目。
前述的社会化搜索系统,其中所述的话题链接包括所述的话题基本信息。
前述的社会化搜索系统,其中所述的话题链接还包括所述的话题关联信息、所述的创建成员信息和/或所述关联成员信息。
前述的社会化搜索系统,其中所述的话题链接还包括用于关注该话题的关注选项。
依据本发明还提出一种搜索结果中包含社会化信息的搜索方法,其特征在于,用于搜索至少一个网络社区中的多个话题,所述话题包括话题基本信息、话题关联信息、创建该话题的创建成员信息和与该话题关联的关联成员信息,其特征在于搜索方法包括以下步骤:搜索请求接收步骤,接收搜索用户提出的搜索请求;以及话题搜索展现步骤,从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题链接展现给所述搜索用户。
本发明还可采用以下技术措施进一步实现。
前述的搜索方法,其还包括网页搜索展现步骤,接收所述搜索请求并将网页搜索结果展现给搜索用户。
前述的搜索方法,其还包括搜索整合步骤,所述搜索整合步骤包括将话题搜索结果和网页搜索结果分别和/或整合展现给所述搜索用户。
前述的搜索方法,其中所述的搜索整合步骤还包括根据排名要素对话题搜索结果和/或网页搜索结果进行排名步骤,所述排名要素选自下述一种或多种要素:所述搜索请求的社会化意图;所述搜索用户是登录该网络社区的成员时,该社区成员的社会化活跃度;所述搜索用户是登录该网络社区的成员时,话题与该社区成员的关联度。
前述的搜索方法,其中所述的搜索整合步骤还包括收集社区成员的行为,调整所述社区成员的社会化活跃度的步骤。
前述的搜索方法,其中所述的话题搜索展现步骤包括:话题索引数据库建立步骤,话题索引数据库存储所述网络社区话题的话题索引;话题搜索步骤,接收搜索用户的搜索请求,从该话题索引数据库中搜索与搜索请求相关联的话题索引;以及话题排序步骤,将所述话题搜索模块搜索到的话题索引所指向的话题进行排序。
前述的搜索方法,其中所述的话题是由网络社区成员创建和/或根据热点的热度创建;所述的话题索引数据库根据网络社区的话题实时更新话题索引。
前述的搜索方法,其中所述的话题索引数据库包括话题名称索引库及话题相关内容索引库;所述话题名称索引库的基本搜索单元是话题名称;所述话题相关内容索引库的基本搜索单元是话题关联信息。
前述的搜索方法,其中所述的话题排序是依据话题与搜索请求关联程度和/或话题被社区成员关注程度排序。
前述的搜索方法,其中所述的话题链接包括所述的话题基本信息。
前述的搜索方法,其中所述的话题链接还包括所述的话题关联信息、所述的创建成员信息和/或所述关联成员信息。
前述的搜索方法,其中所述的话题链接还包括用于关注该话题的关注选项。本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明的社会化搜索系统及搜索方法,至少具有下列优点:
一、本发明的社会化搜索系统及搜索方法,能够使得搜索结果包含社会化信息。
二、本发明的社会化搜索系统及搜索方法,能够利用搜索用户的社会化信息影响返回给搜索用户的搜索结果,搜索结果更贴近搜索用户的自身需求。
三、本发明的社会化搜索系统及搜索方法,也更好地反映不同维度的对社会化(用户共享)信息的倾向性的不同。
附图说明
图1是实施本发明社会化搜索系统的网络架构的方框示意图。
图2是本发明中话题的示意图。
图3是本发明的话题搜索系统的方框示意图。
图4是本发明的话题索引数据库的示意图。
图5是本发明的话题排序模块的示意图。
图6是本发明的搜索整合系统的示意图。
图7是本发明的话题搜索结果展现示意图。
图8是本发明的话题搜索结果与网页搜索结果综合展现示意图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的社会化搜索系统及搜索方法其具体实施方式、步骤、结构、特征及其功效详细说明。
本发明提出一种社会化搜索系统,用于搜索网络社区的话题,搜索结果包含社会化信息。
所述的网络社区可以是针对某一领域的专业网络社区(例如专利论坛、游戏社区、汽车论坛、网店平台、博客平台等等),也可以是包含多领域的综合网络社区。本发明的网络社区至少包括社区成员、社区成员关联信息及社区成员创建的话题。
话题是互联网内容聚合生成的概念的载体,很多情况下,一个话题对应于一个传统垂直网站的一个分类。例如,“数码相机”是一个典型的电子商务网站对产品的一个分类,“古龙小说”是一个在线图书小说阅读网站对小说的一个分类。但是,相对于传统垂直网站比较固定的分类结构,在本发明中话题是由网络社区的成员生成的针对某个概念的信息聚合的载体。
本发明中的话题可由网络社区成员自主创建生成。所述话题包括话题基本信息、话题关联信息、创建该话题的创建成员信息和与该话题关联的关联成员信息。话题创建成员可以输入话题基本信息,包括但不限于话题名称、话题描述、话题图片和话题分类等。话题的主要内容通过话题名称表达(比如“数码相机”或“古龙小说”),该话题创建成员拥有话题管理权限,可以修改、更新话题基本信息。话题关联信息包括,与该话题关联的问题、问题的答复、该话题的评论、与该话题关联的关联成员等,话题关联信息由创建成员或/和关联成员生成。
本发明中的“社会化信息”也可称为社交化信息,体现为网络社区中社区成员的社交化行为,例如创建话题、修改话题基本信息、点击话题、浏览话题、与其他成员建立关系(朋友、粉丝等)、提出问题、答复问题、关注话题、发表评论、搜索话题等等行为,但不限于此。
本发明的社会化搜索系统至少包括,搜索接口及话题搜索系统。搜索接口接收搜索用户提出的搜索请求,并判断该搜索用户是否为所述网络社区的登录成员;该话题搜索系统,从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题的链接展现给所述搜索用户。本发明的社会化搜索系统,搜索结果包含社会化信息。所述搜索请求包括搜素关键词或搜索词。
根据如下因素对话题进行排序:话题名称与搜索关键词精确匹配程度;话题名称包含搜索关键词的程度;关注话题的成员总数;话题相关条目的总条目数;与搜索词匹配的话题相关条目的条目数。另外,搜索用户是社区成员用户时,还考虑以下因素:话题关联成员与该搜索用户的匹配程度;与搜索词匹配的话题相关条目中搜索用户的朋友参与(编辑,关注)的数日。
本发明的社会化搜索系统还包括网页搜索系统,接收所述搜索请求并将网页搜索结果展现给搜索用户。网页搜索系统可以是现有的搜索引擎技术,其搜索结果包括网站、网页、博客、文章等互联网上公开资源。
本发明的社会化搜索系统还包括搜索整合模块,用于将话题搜索结果和网页搜索结果排名后单独和/或整合展现给所述搜索用户。所述搜索整合模块根据搜索请求的社会化意图、和/或所述搜索用户的社会化活跃度,对话题搜索结果排名或者对该话题搜索系统排序的话题重新排名。
下面通过一个具体实施例详细说明。请参阅图1所示,是运行本发明社会化搜索系统的网络构架的方框示意图。该网络构架包括用户终端3、网络1和服务器端8。
本发明较佳实施例的社会化搜索系统100可以安装于服务器端8,包括搜索接口5、话题搜索系统10、网页搜索系统20及搜索整合模块30。所述社会化搜索系统100,用于搜索网络社区的话题。所述网络社区包括社区成员、社区成员关联信息及社区成员创建的话题;社区成员信息、社区成员关联信息存储在网络社区数据库40,话题存储在网络社区数据库40中的话题数据库50。社区成员信息包括成员ID、地址、兴趣、年龄、性别等个人基本信息;社区成员关联信息包括成员的好友、粉丝等信息,但不以此为限。搜索用户通过用户终端3输入搜索请求,搜索请求通过网络1传递到服务器端的社会化搜索系统100;社会化搜索系统100返回的搜索结果在用户终端3展现给搜索用户。用户终端3具有可以输入搜索请求并展现搜索结果的模块,例如浏览器。用户终端3可以是实体装置(例如个人计算机、无线电话、个人数字助理(PDA)、笔记本电脑或其它类型的计算机或通信装置)、在这些装置中的一个上运行的线程或进程、和/或可由这些装置中的一个执行的对象。
所述的搜索接口5接收搜索请求,并将搜索请求内容传递给话题搜索系统10和网页搜索系统20;所述的话题搜索系统10针对网络社区中话题进行搜索并返回话题搜索结果;所述的网页搜索系统20针对网页进行搜索并返回网页搜索结果;搜索整合模块30将话题搜索系统10搜索结果和网页搜索系统20搜索结果返回给搜索接口5;搜索接口5将最终搜索结果在用户终端3展现给搜索用户。搜索结果的展现内容,可以是综合了话题和网页搜索结果的整合搜索结果(如图7所示),也可以是仅包括话题搜索结果(如图8所示)或网页搜索结果。
搜索用户可分为两种用户,一种是登录了网络社区的社区成员用户,另一种是没有登录网络社区的普通用户。搜索接口5接收搜索请求时判断搜索用户是否为社区成员用户,具体是通过读取网络社区数据库40中成员信息来判断。
上述服务器端和用户终端设备在架构上都包含一些基本组件,如总线、处理装置、存储装置、输入输出装置和通信接口等。总线可以包括一个或多个导线,用来实现服务器端或用户终端设备各组件之间的通信。处理装置包括各类型的用来执行指令、处理进程或线程的处理器或微处理器。存储装置可以包括存储动态信息的随机访问存储器(RAM)等动态存储器,和存储静态信息的只读存储器(ROM)等静态存储器,以及包括磁或光学记录介质与相应驱动的大容量存储器。输入装置供用户输入信息到服务器端或用户终端设备,如键盘、鼠标、手写笔、声音识别装置、或生物测定装置等。输出装置包括用来输出信息的显示器、打印机、扬声器等。通信接口用来使服务器端或用户终端设备与其它系统或装置进行通信。通信接口之间可通过有线连接、无线连接、或光连接到网络中,使社会化搜索系统100、用户终端3间能够通过网络实现相互间的通信。网络可以包括局域网(LAN)、广域网(WAN)、电话网络如公共交换电话网(PSTN)、企业内部的互联网、因特网、或上述这些网络的结合等。服务器和用户终端设备上均包含有用来管理系统资源、控制其它程序运行的操作系统软件,以及用来实现特定功能模块的应用软件。
如图2所示,是本发明中话题的示意图。话题60是由多个条目组成,包括话题名称61、话题描述63、话题创建成员信息62、问题64和答复65、66、问题提出的成员信息69、评论67、评论的成员信息69、关注该话题的成员信息68等等,但不以此为限制,也可以包括网页、照片、图片和成员创建的其他内容。其中,话题名称61、话题描述63、话题创建成员信息62是话题基本信息;问题64和答复65、66、问题提出的成员信息69、评论67、评论的成员信息69、关注该话题的成员信息68是话题关联信息。其中其他成员提出的内容(如问题、评论)与话题是相关联的。以问题为例,问题与话题发生关联有两种方式:成员提出问题时主动增加话题标签,比如问题是“哪款数码相机好?”,成员可以为其添加“数码相机”话题标签,该问题“哪款数码相机好?”显示在所有话题名称为“数码相机”的话题中,问题与话题就发生了关联。另一种是,成员提出问题时话题搜索系统10根据成员提出的问题推荐话题标签:具体流程包括,将成员提出的问题转化成一个搜索词,如果提出的问题的文本内容较多,进行基于语义分析的核心词提取,去除不重要的词或者短句;用生成的搜索词对话题索引数据库进行搜索,将最好的话题结果作为推荐呈现给成员;成员可以选择一个或者多个话题;问题将显示在所有同名的话题中。
话题除了由社区成员主动创建外,还可以根据热点“热度”自动创建。社会化搜索系统100包括热点发现模块及根据热点“热度”自动创建话题模块。其热点数据来源有两种:一是成员对成员自己生成内容(UGC)打标签(比如成员提问有关数码相机的内容时,可以对问题打上标签“数码相机”),系统将用所打的标签,查询话题数据库,如果不存在,将自动建立一个以该标签命名的热点;二是,用户在搜索过程中对所搜索的关键词可以进行关注,当成员关注了某个关键词后,将查询话题数据库,如果不存在,将自动建立一个以该关键词命名的热点。该自动创建话题模块将根据热点的“热度”来确定是否自动创建为话题,一个热点的热度信号包括(但不仅限于)以下属性:以同名标签标注用户生成内容的用户数(反映了该热点的关注该广度)、以同名标签标注用户生成内容的条目数(反映了该热点的关注活跃度)、以与热点名相同的关键词进行关注/搜索的总数(反映了该热点的关注持久度)、在近期以与热点名相同的关键词进行关注/搜索的总数(反映了该热点的时鲜度);自动创建话题模块根据热点成为话题后的用户活跃度进行机器学习,自动调整“热点”的各个热度信号的权重。
请参阅图3所示,是本发明的话题搜索系统的方框示意图。所述话题搜索系统10包括话题索引数据库15、话题搜索模块13及话题排序模块11。
上述的话题索引数据库15根据话题数据库50的话题实时更新,存储网络社区话题的话题索引。如图4所示,话题索引数据库15包括话题名称索引库151及话题相关内容索引库153。话题名称索引库151,其基本搜索单元是话题名称,如果网络社区中有多个话题名称相同的话题,会被多个搜索单元表示,即社区成员可创建话题名称相同的话题,话题名称相同话题在网络社区中是互相独立的。话题相关内容索引库153,其基本搜索单元是话题相关条目,例如但不仅限于其他成员针对一个话题的提问、回答、评论等。
话题名称索引库151及话题相关内容索引库153的每一个基本搜索单元由存储在内存的一组“表征”(token)所表示。所述表征包括,属于不同性质的文本内容条目(例如话题名称,话题描述,问题标题,问题扩展说明)中包含的词(经过切词以后的基本语义单位);由各种数据类型(话题,成员)的ID所转化而成的在整个索引中唯一的字符串;基本搜索单元的其他(数值,枚举,和字符串类型的)属性。属于同一个基本搜索单元的所有表征存储在一个连续的内存空间里。每一个表征有一个索引链表(倒排表),存储(按照递增顺序)该表征在所有基本搜索单元里出现的位置(内存地址,token position)。当沿着一个表征的索引链表遍历时,可以通过内存地址倒算出包含该表征的当前基本搜索单元。一个基本搜索单元的表征可以包含属性,以表示该表征的重要性和匹配方法。
话题名称索引库151以如下内容建立表征和索引:话题的名称,话题的描述,所有关注该话题的成员ID,和话题高度相关的高质量网页(例如话题所对应的百科类网页或者官方首页)所抽取的相关信息。对于高质量网页的识别是基于如下信息,用户以话题名作为关键词进行搜索时,点击率高而且稳定的网页;锚文本和话题名称高度吻合的网页(排除作弊网站)。
话题相关内容索引库153以如下内容建立表征和索引:话题相关条目(问题,答案,评论)的文本信息;所关联的(一个或者多个)话题的话题ID;关注/编辑该条目的成员的成员ID;话题相关内容条目的属性(例如已解答(针对问题条目)、最佳答案(针对答案条目),及其更新时间等)。
前述的话题搜索模块13根据搜索请求,同时搜索话题名称索引库151和话题相关内容索引库153,返回的结果包含话题名称索引库151搜索出来的高质量话题,及话题相关内容索引库153搜索出来的话题相关条目高度关联的话题。比如搜索“索尼数码相机”时,可能返回两类话题结果:通过话题名称索引库151搜索出来的直接与“索尼数码相机”相关的话题,比如“索尼相机”,“索尼数码相机”,“索尼单反相机”等话题;通过话题相关内容索引库153,找到了用户创建的问题或者评论,比如比较各种型号的数码相机,再通过该问题或评论的链表中的话题表征,查到“尼康数码相机”或“佳能数码相机”话题。
前述的话题排序模块11针对话题搜索模块13搜索的话题排序,话题排序模块11包括话题表征权值计算模块111(如图5所示)。话题排序包括以下步骤。步骤一,当搜索用户是社区成员用户时,从搜索请求中取出社区成员ID,从网络社区数据库中获取影响话题相关度的社会化信息,例如社区成员用户关注的所有社区成员(即单向的“朋友”)列表,以及该社区成员用户的一个或多个的成员信息(比如,性别,年龄,所在城市等等)等。步骤二,对于话题搜索模块13返回的每一个话题,从相对应的基本搜索单元的内存空间的表征向量中获取影响话题相关度的社会化信息。步骤三,根据如下的因素对话题进行打分:话题名称与搜索词(即,搜索请求中搜索词)精确匹配(exact match)(比如搜索词为“数码相机”,话题名也为“数码相机”);话题名包含搜索词的程度(partial match)(比如搜索词为“数码相机”,话题名为“索尼数码相机”);关注话题的成员总数(由话题名称索引库返回),反映了话题的受欢迎程度;话题相关条目的条目总数(由话题名索引库返回),反映了话题的活跃程度;话题的关联成员与提出搜索请求的社区成员匹配程度,反映了话题与搜索用户的社会化相关度(比如来自“北京市”的用户搜索,如果话题的关联成员也有很多来自“北京市”,匹配程度较高);关注话题的成员中该搜索用户(搜索用户是社区成员用户)的朋友的人数,反映了话题与搜索用户的社会化相关度(比如关注“数码相机”话题的关联成员中,有很多是提出搜索请求的用户所关注的人,匹配程度较高);与搜索词匹配的话题相关条目的条目结果数(由话题相关内容索引库返回的结果根据相关话题聚合获得),反映了话题内容与关键词的相关度(比如“哪个数码相机好”这个问题与“数码相机”搜索词相关,而该问题指向的话题为“索尼数码相机”,则“索尼数码相机”话题与搜索词“数码相机”有较高的相关度);与搜索词匹配的话题相关条目的条目结果(由话题相关内容索引库返回的结果获得)中该搜索用户(搜索用户是社区成员用户时)的朋友参与(编辑,关注)的数目,反映了话题内容与搜索用户的社会化相关度(比如“哪个数码相机好”这个问题与“数码相机”搜索词相关,而关注该问题的用户中,很多也是该搜索用户关注的人,该问题指向的话题为“索尼数码相机”,则名称为“索尼数码相机”的话题与搜索词“数码相机”有较高的相关度)。步骤四,根据话题所得分数对话题搜索模块13搜索到的话题排序。所述的话题排序因素,通过对社区成员历史行为进行定期地机器学习来调整,即不同因素的权重不是固定不变的,根据网络社区数据库记录的信息定期进行调整。
请参阅图6所示,是本发明的搜索整合系统30的示意图。前述的搜索整合系统30可以对话题搜索结果和/或网页搜索结果进行排名,并且将话题搜索结果和网页搜索结果分别和/或综合展现给所述搜索用户。前述的搜索整合系统30包括搜索词社会化意图分析模块31、用户社会化活跃度识别模块33、结果整合模块35、用户搜索行为分析反馈模块37。
该搜索词社会化意图分析模块31,对(搜索请求的)搜索关键词的社会化意图进行识别,识别要素包括:一、搜索关键词是否为问题类型搜索词,从语法和语义上和一个问题相似的搜索关键词相对来说更需要社会化搜索结果;二、搜索关键词是否有清晰的单一的非主观需求,例如,包含“在线观看”或者“在线阅读”词根的搜索关键词所需要的是静态的互联网内容,而非社会化内容;三、搜索关键词的“热度”,对于社会热点和最近发生的事件,搜索用户相对来说更需要社会化信息,因为社会化信息补充了传统网页搜索结果的时效性。
该用户社会化活跃度识别模块33,用于识别社区成员的社会化活跃度。一种实施例方式中,社区成员的社会化活跃度是基于社区成员对社会化信息的参与程度、搜索历史中对社会化结果和/或话题结果的点击率确定。社区成员对社会化信息的参与,例如是话题创建、提出问题、答复问题、发表评论、关注的其他成员等在网络社区中的活动或行为。
该结果整合模块35,根据排名要素对话题搜索结果和/或网页搜索结果进行排名,所述排名要素选自下述一种或多种要素:所述搜索请求的社会化意图;所述搜索用户是登录该网络社区的成员时,该社区成员的社会化活跃度;所述搜索用户是登录该网络社区的成员时,话题与该社区成员的关联度。该结果整合模块35进一步将话题搜索结果和网页搜素结果整合(如图7所示),整合步骤包括:首先将搜索结果中的话题的权值和网页的权值归一化;根据话题结果和网页结果的权值,从高到低排名。每一个话题结果都有一个绝对权值,表明这个话题结果对于当前搜索词的相关度;同样的,对于每一个网页结果也有一个绝对权值,表明该网页结果对于当前搜索词的相关度。话题的权值范围和网页的权值范围是不同的,比如话题的权值范围是1000-5000,网页的权值范围是100-200;一个简单的归一化方法是将网页的权值线性变换到1000-5000的区间,使其与话题可以直接比较。其他实施例中,变换的条件复杂,往往不是线性的,而是根据不同区间有不同的匹配函数,区间的划分是动态的,对于不同类型的搜索词,区间的划分粒度和变换函数都可能不同。整合后排名结果中可以有一个或多个话题结果,话题结果出现的位置视其相对网页结果的权值排名而定(如图7所述)。
该用户搜索行为分析反馈模块37,收集社区成员的点击、浏览、创建话题的行为,调整所述社区成员的社会化活跃度和整合模块中的变换函数。比如对于搜索词“数码相机”,初始的整合模块将“索尼数码相机”话题放在了整合搜索页的第四位,但从搜索用户(社区成员用户)的行为来看,社区成员经常点击该话题,点击率超过了排在它之前的网页结果,那么会对变换函数进行调整,增加该话题的权值,未来它可能会出现在更高的位置。搜索行为分析反馈模块37定期将数据反馈给整合模块,整合模块35利用机器学习定期调整整合算法。
本实施例的搜索结果展现方式有三种,一种是如图7所示话题和网页的整合展现方式,另一种是如图8所示的话题单独展现方式,在一种网页单独展现方式(未图示)。搜索用户可以点击搜索结果中话题链接或网页链接,进入该话题或网页。话题链接中,至少包括话题名称,还可以包括话题其他基本信息、话题关联信息、话题关注成员人数。话题链接中还可以包括关注该话题的关注选项。
本实施例的社会化搜索系统的社会化搜索结果不仅反映在搜索用户的社会化信息会影响话题搜索结果,而且也反映在(搜索请求的)搜索关键词的社会化意图影响搜索结果。不同维度的对社会化(用户共享)信息的倾向性的不同。不同搜索用户对社会化信息的不同倾向性,例如,一个在微博和脸谱(Facebook)等网络社区上很活跃用户更为乐于见到搜索结果中包含社会化相关度高的话题结果;所有用户作为一个整体对不同类别的搜索关键词的社会化信息的不同倾向性,例如,搜索词“步步惊心”普遍地来说更需要社会化相关度高的结果,因为朋友对这部最新的电视连续剧的看法是搜索用户所乐于见到的;而搜索词“射雕英雄传在线观看”则不需要太多的社会化信息,因为大量的网页结果已经包含了用户所需要的内容。
上述本发明示例实施例的描述并非是要穷尽或将本发明限定在所公开的特定形式。例如,尽管关于图7描述了一系列步骤,这些步骤的顺序可以在与本发明一致的其它实施方式中被改变。另外,非从属性的步骤可以被并行实现。
虽然本发明已以较佳实施例揭露如上,然并非用以限定本发明实施的范围,依据本发明的权利要求书及说明内容所作的简单的等效变化与修饰,仍属于本发明技术方案的范围内。

Claims (10)

1.一种社会化搜索系统,其特征在于,所述社会化搜索系统用于搜索至少一个网络社区的多个话题,所述话题包括话题基本信息、话题关联信息、创建该话题的创建成员信息和与该话题关联的关联成员信息,所述搜索系统包括:
搜索接口,接收搜索用户提出的搜索请求,并判断该搜索用户是否为所述网络社区的社区成员;以及
话题搜索系统,从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题的链接展现给所述搜索用户。
2.如权利要求1所述的社会化搜索系统,其特征在于其还包括网页搜索系统,接收所述搜索请求并将网页搜索结果展现给搜索用户;所述社会化搜索系统还包括搜索整合模块,所述搜索整合模块将话题搜索结果和网页搜索结果单独和/或整合展现给所述搜索用户;
其中所述的搜索整合模块根据排名要素对话题搜索结果和/或网页搜索结果进行排名,所述排名要素选自下述一种或多种要素:
所述搜索请求的社会化意图;
所述搜索用户是登录该网络社区的成员时,该社区成员的社会化活跃度;
所述搜索用户是登录该网络社区的成员时,话题与该社区成员的关联度。
3.如权利要求1所述的社会化搜索系统,其特征在于其中所述的话题搜索系统包括:
话题索引数据库,存储所述网络社区话题的话题索引;
话题搜索模块,接收搜索用户的搜索请求,从该话题索引数据库中搜索与搜索请求相关联的话题索引;以及
话题排序模块,将所述话题搜索模块搜索到的话题索引所指向的话题进行排序。
4.如权利要求3所述的社会化搜索系统,其特征在于其中所述的话题是由网络社区成员创建和/或根据热点的热度创建;所述的话题索引数据库根据网络社区的话题实时更新话题索引。
5.如权利要求1或4所述的社会化搜索系统,其特征在于其中,话题排序是根据下述一种或多种因素排序:
话题与搜索请求匹配程度;
关注话题的成员总数;
话题相关条目的总条目数;
与搜索请求匹配的话题相关条目的条目数;
当搜索用户是社区成员时,话题关联成员与该搜索用户的匹配程度;
当搜索用户是社区成员时,与搜索请求匹配的话题相关条目中搜索用户的朋友参与的数目。
6.一种社会化搜索方法,其特征在于,用于搜索至少一个网络社区中的多个话题,所述话题包括话题基本信息、话题关联信息、创建该话题的创建成员信息和与该话题关联的关联成员信息,所述的搜索方法包括以下步骤:
搜索请求接收步骤,接收搜索用户提出的搜索请求;以及
话题搜索展现步骤,从所述网络社区的多个话题中搜索与所述搜索请求匹配的话题,并将搜索到的话题排序后将话题链接展现给所述搜索用户。
7.如权利要求6所述的搜索方法,其特征在于其还包括网页搜索展现步骤,接收所述搜索请求并将网页搜索结果展现给搜索用户;所述社会化搜索系统还包括搜索整合步骤,包括将话题搜索结果和网页搜索结果单独和/或整合展现给所述搜索用户;
其中所述的搜索整合步骤还包括根据排名要素对话题搜索结果和/或网页搜索结果进行排名步骤,所述排名要素选自下述一种或多种要素:
所述搜索请求的社会化意图;
所述搜索用户是登录该网络社区的成员时,该社区成员的社会化活跃度;
所述搜索用户是登录该网络社区的成员时,话题与该社区成员的关联度。
8.如权利要求6所述的搜索方法,其特征在于其中所述的话题搜索展现步骤包括:
话题索引数据库建立步骤,话题索引数据库存储所述网络社区话题的话题索引;
话题搜索步骤,接收搜索用户的搜索请求,从该话题索引数据库中搜索与搜索请求相关联的话题索引;以及
话题排序步骤,将所述话题搜索模块搜索到的话题索引所指向的话题进行排序。
9.如权利要求8所述的搜索方法,其特征在于其中所述的话题是由网络社区成员创建和/或根据热点的热度创建;所述的话题索引数据库根据网络社区的话题实时更新话题索引。
10.如权利要求6或8所述的搜索方法,其特征在于其中,话题排序是根据下述一种或多种因素排序:
话题与搜索请求匹配程度;
关注话题的成员总数;
话题相关条目的总条目数;
与搜索请求匹配的话题相关条目的条目数;
当搜索用户是社区成员时,话题关联成员与该搜索用户的匹配程度;
当搜索用户是社区成员时,与搜索请求匹配的话题相关条目中搜索用户的朋友参与的数目。
CN2012100820232A 2011-09-29 2012-03-26 社会化搜索系统及搜索方法 Pending CN103034672A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100820232A CN103034672A (zh) 2011-09-29 2012-03-26 社会化搜索系统及搜索方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110291006.5 2011-09-29
CN201110291006 2011-09-29
CN2012100820232A CN103034672A (zh) 2011-09-29 2012-03-26 社会化搜索系统及搜索方法

Publications (1)

Publication Number Publication Date
CN103034672A true CN103034672A (zh) 2013-04-10

Family

ID=48021569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100820232A Pending CN103034672A (zh) 2011-09-29 2012-03-26 社会化搜索系统及搜索方法

Country Status (1)

Country Link
CN (1) CN103034672A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182488A (zh) * 2014-08-08 2014-12-03 腾讯科技(深圳)有限公司 搜索方法、服务器及客户端
CN104506615A (zh) * 2014-12-19 2015-04-08 天脉聚源(北京)科技有限公司 一种用于无线网络应用平台的标识讨论群组的方法及装置
CN105224555A (zh) * 2014-06-12 2016-01-06 北京搜狗科技发展有限公司 一种搜索的方法、装置和系统
CN105869057A (zh) * 2016-04-07 2016-08-17 腾讯科技(深圳)有限公司 评论存储设备、评论读取、评论写入方法及装置
CN106294806A (zh) * 2016-08-15 2017-01-04 马岩 论坛大数据的安全搜索方法及系统
CN106663111A (zh) * 2014-09-15 2017-05-10 谷歌公司 评估搜索查询的语义解释
CN106777205A (zh) * 2016-12-23 2017-05-31 北京奇虎科技有限公司 游戏类搜索词的搜索方法及装置
CN106960039A (zh) * 2017-03-28 2017-07-18 西安电子科技大学 基于整子多Agent的社会化搜索引擎系统
CN109388745A (zh) * 2018-06-15 2019-02-26 云天弈(北京)信息技术有限公司 一种批量文章自动写作系统
CN114238229A (zh) * 2022-02-24 2022-03-25 北京辰光信安电子有限公司 一种打印文件的搜索方法、装置、电子设备和存储介质
CN115062586A (zh) * 2022-08-08 2022-09-16 山东展望信息科技股份有限公司 一种基于大数据和人工智能的热点话题处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949732A (zh) * 2006-10-12 2007-04-18 百度在线网络技术(北京)有限公司 网络社区与搜索的结合的方法以及系统
CN102016825A (zh) * 2007-08-17 2011-04-13 谷歌公司 对社交网络对象进行排名
CN102150161A (zh) * 2008-09-12 2011-08-10 北方电讯网络有限公司 基于密切关系准则对搜索结果进行排序

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949732A (zh) * 2006-10-12 2007-04-18 百度在线网络技术(北京)有限公司 网络社区与搜索的结合的方法以及系统
CN102016825A (zh) * 2007-08-17 2011-04-13 谷歌公司 对社交网络对象进行排名
CN102150161A (zh) * 2008-09-12 2011-08-10 北方电讯网络有限公司 基于密切关系准则对搜索结果进行排序

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224555B (zh) * 2014-06-12 2019-12-10 北京搜狗科技发展有限公司 一种搜索的方法、装置和系统
CN105224555A (zh) * 2014-06-12 2016-01-06 北京搜狗科技发展有限公司 一种搜索的方法、装置和系统
WO2016019925A1 (zh) * 2014-08-08 2016-02-11 腾讯科技(深圳)有限公司 搜索方法、服务器及客户端
CN104182488A (zh) * 2014-08-08 2014-12-03 腾讯科技(深圳)有限公司 搜索方法、服务器及客户端
CN104182488B (zh) * 2014-08-08 2016-09-07 腾讯科技(深圳)有限公司 搜索方法、服务器及客户端
CN106663111B (zh) * 2014-09-15 2020-08-07 谷歌有限责任公司 评估搜索查询的语义解释
CN106663111A (zh) * 2014-09-15 2017-05-10 谷歌公司 评估搜索查询的语义解释
CN104506615A (zh) * 2014-12-19 2015-04-08 天脉聚源(北京)科技有限公司 一种用于无线网络应用平台的标识讨论群组的方法及装置
CN105869057A (zh) * 2016-04-07 2016-08-17 腾讯科技(深圳)有限公司 评论存储设备、评论读取、评论写入方法及装置
CN105869057B (zh) * 2016-04-07 2020-10-09 腾讯科技(深圳)有限公司 评论存储设备、评论读取、评论写入方法及装置
CN106294806A (zh) * 2016-08-15 2017-01-04 马岩 论坛大数据的安全搜索方法及系统
CN106777205A (zh) * 2016-12-23 2017-05-31 北京奇虎科技有限公司 游戏类搜索词的搜索方法及装置
CN106960039A (zh) * 2017-03-28 2017-07-18 西安电子科技大学 基于整子多Agent的社会化搜索引擎系统
CN106960039B (zh) * 2017-03-28 2019-12-10 西安电子科技大学 基于整子多Agent的社会化搜索引擎系统
CN109388745A (zh) * 2018-06-15 2019-02-26 云天弈(北京)信息技术有限公司 一种批量文章自动写作系统
CN114238229A (zh) * 2022-02-24 2022-03-25 北京辰光信安电子有限公司 一种打印文件的搜索方法、装置、电子设备和存储介质
CN115062586A (zh) * 2022-08-08 2022-09-16 山东展望信息科技股份有限公司 一种基于大数据和人工智能的热点话题处理方法

Similar Documents

Publication Publication Date Title
Sun et al. Conversational recommender system
García-Sánchez et al. A social-semantic recommender system for advertisements
CN103034672A (zh) 社会化搜索系统及搜索方法
US10728203B2 (en) Method and system for classifying a question
US10180979B2 (en) System and method for generating suggestions by a search engine in response to search queries
CN101385025B (zh) 通过分析内容确定上下文并且基于该上下文提供相关内容
US8438124B2 (en) System and method of a knowledge management and networking environment
US9081853B2 (en) Information display system based on user profile data with assisted and explicit profile modification
CN104471571B (zh) 事件驱动架构下对Web活动索引、排序和分析的系统和方法
US10198776B2 (en) System and method for delivering an open profile personalization system through social media based on profile data structures that contain interest nodes or channels
CN111859160B (zh) 一种基于图神经网络会话序列推荐方法及系统
US11080287B2 (en) Methods, systems and techniques for ranking blended content retrieved from multiple disparate content sources
US10540666B2 (en) Method and system for updating an intent space and estimating intent based on an intent space
US20080140786A1 (en) Systems and methods for commercializing ideas or inventions
US11449553B2 (en) Systems and methods for generating real-time recommendations
TW200917070A (en) System and method to facilitate matching of content to advertising information in a network
KR102155342B1 (ko) 다중파라미터 분석 기반 인플루언서 매칭을 이용한 광고 서비스 제공 시스템
CN101520784A (zh) 信息发布系统和信息发布方法
US20130035996A1 (en) Social advertising technology (so-ad-tec) system and method for advertising for and in documents, and other systems and methods for accessing, structuring, and evaluating documents
US11232522B2 (en) Methods, systems and techniques for blending online content from multiple disparate content sources including a personal content source or a semi-personal content source
Strobbe et al. Interest based selection of user generated content for rich communication services
US20170098180A1 (en) Method and system for automatically generating and completing a task
KR102322668B1 (ko) 콘텐츠 크리에이터의 창작활동 활성화를 위한 다중 플랫폼 서비스 제공 시스템
US11216735B2 (en) Method and system for providing synthetic answers to a personal question
US10929905B2 (en) Method, system and machine-readable medium for online task exchange

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130410