CN102164186A - 一种实现云搜索服务的方法及系统 - Google Patents

一种实现云搜索服务的方法及系统 Download PDF

Info

Publication number
CN102164186A
CN102164186A CN2011101448187A CN201110144818A CN102164186A CN 102164186 A CN102164186 A CN 102164186A CN 2011101448187 A CN2011101448187 A CN 2011101448187A CN 201110144818 A CN201110144818 A CN 201110144818A CN 102164186 A CN102164186 A CN 102164186A
Authority
CN
China
Prior art keywords
resource
website
service end
cloud service
site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011101448187A
Other languages
English (en)
Other versions
CN102164186B (zh
Inventor
潘海东
梅春
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Interactive Encyclopedia Network Technology Co.,Ltd.
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Interactive Online (beijing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Interactive Online (beijing) Technology Co Ltd filed Critical Interactive Online (beijing) Technology Co Ltd
Priority to CN 201110144818 priority Critical patent/CN102164186B/zh
Publication of CN102164186A publication Critical patent/CN102164186A/zh
Application granted granted Critical
Publication of CN102164186B publication Critical patent/CN102164186B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种实现云搜索服务的方法及系统。具体地说,本发明公开了一种云搜索服务注册方法,该方法包括:站点发送注册申请至云服务端,所述注册申请至少包括站点域名;所述云服务端根据所述注册申请为所述站点分配站点ID,并根据所述站点ID建立所述站点的资源索引的目录;所述云服务端采集所述站点的资源并存储,根据所述站点资源生成站点资源索引;所述云服务端根据所述站点资源索引的目录定义的位置存储所述站点资源索引。本发明进一步公开了云服务端的站点资源索引更新方法、云搜索服务系统中的搜索方法以及一种云搜索服务系统。通过本发明,站点无需考虑资源索引存储以及其他搜索技术细节。

Description

一种实现云搜索服务的方法及系统
技术领域
本发明涉及信息检索领域,具体涉及一种实现云搜索服务的方法及系统,即实现云服务端为站点提供搜索服务的方法和系统。
背景技术
随着互联网技术的发展,搜索已经成为网站必不可少的功能。在个人建站系统中,常用的站内搜索技术主要有三种。
1、基于数据库的搜索
通过数据库sql语句的单字索引功能完成最简单的索引功能和最低级的全文检索,且只能进行标题的检索,处于检索时,数据库消耗大量硬件资源,无法开展各种附加功能,效率非常低下。
2、基于spider抓取的站内搜索
通过spider抓取网页,经html解析,分词,索引实现网页式站内搜索,
这样做的的缺点是:有大量的不必要的信息影响搜索结果的排序和显示效果,严重影响搜索精确度,并且用户对搜索范围和内容以及呈现的结果无法精确控制。
3、基于搜索引擎的站内搜索
很多站点使用大型搜索引擎如Google的站内检索site.domain.com代替了自己的站内数据库全文检索,但依靠Google这样的大型搜索引擎并不会深度遍历一个网站,也不会将该网站的所有内容都收录并索引,而是只收录最新更新的静态网页,且缺少入口的网站内容将逐渐被抛弃,此外,搜索引擎针对站点的更新频率也是有一定周期的,很多内容需要一定时间后才能收录。
另外,搜索引擎技术门槛较高,需要高性能的服务器和技术人员支持,对普通的个人站点来说不适合。
因此,需要为站点提供一种针对站点内容、实时动态更新、分站点索引以及高效地提供搜索服务的方法。
发明内容
本发明的目的在于,通过云服务端为站点提供站点资源搜索的服务,使得站点无需考虑资源索引存储以及其他搜索技术细节。
本发明的又一目的在于,当用户在站点进行搜索时,该站点不仅能够将本站点的相关内容呈现给用户,必要时还能够将注册入云服务端的所有联盟站点的相关内容也呈现给用户。
根据本发明,提供一种云搜索服务注册方法,该方法包括以下步骤:
站点发送注册申请至云服务端,所述注册申请至少包括站点域名;
所述云服务端根据所述注册申请为所述站点分配站点ID,并根据所述站点ID建立所述站点的资源索引的目录;
所述云服务端采集所述站点的资源并存储,根据所述站点资源生成站点资源索引;
所述云服务端根据所述站点资源索引的目录定义的位置存储所述站点资源索引。
优选地,所述方法还包括,云服务端将所述站点的注册申请、站点ID以及站点资源索引的目录以一一对应的方式存储。
优选地,所述注册申请还包括站点名称和/或站点状态。
优选地,所述云服务端在其存储的所有站点的资源的基础上生成总资源索引。
优选地,所述目录采用多级目录的方式建立。
优选地,所述云服务端采集所述站点的资源并存储包括:
所述云服务端通过所述站点提供的资源标准化内容接口采集所述站点的资源,所述站点资源包括标准化内容,所述标准化内容包括资源访问地址、资源ID、资源名称、资源分类、资源正文和资源最后修改时间;
所述云服务端存储所述资源的标准化内容。
优选地,所述资源的标准化内容还包括资源标签、资源摘要、资源作者ID、资源作者、资源创建时间、资源浏览量、资源编辑次数、资源版本数和资源评论数中的至少一个。
优选地,所述站点提供的资源标准化内容接口采用XML语言编写,并对每个资源有独立的资源访问地址。
优选地,所述资源为词条、文章、图片和视频中的至少一种。
根据本发明,提供一种云搜索服务系统中的云服务端的站点资源索引更新方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引的目录、站点资源索引以及站点资源,该方法包括以下步骤:
站点响应用户对站点资源所做的编辑,发送更新消息至云服务端,所述更新消息包括站点域名、资源访问地址、资源类型和编辑模式;
所述云服务端调用所述资源访问地址,以获取所述站点资源;
所述云服务端根据所述站点域名和资源类型得到其存储的所述站点的该类型的资源和资源索引的目录,进而获取其存储的所述站点的该类型的资源索引;
所述云服务端利用其获取的站点资源,根据所述编辑模式更新其存储的所述站点的该类型的资源,并根据更新后的站点资源更新其存储的站点资源索引。
优选地,所述资源类型为词条类型、文章类型、图片类型和视频类型中的一种;所述编辑模式为创建、修改、删除和恢复中的一种。
优选地,所述站点资源包括标准化内容,所述标准化内容包括资源访问地址、资源ID、资源名称、资源分类、资源正文和资源最后修改时间。
优选地,所述资源的标准化内容还包括资源标签、资源摘要、资源作者ID、资源作者、资源创建时间、资源浏览量、资源编辑次数、资源版本数和资源评论数中的至少一个。
优选地,所述方法进一步包括,所述云服务端接收自所述站点发送的更新消息,将其放入消息队列,通过监听消息队列,对所述更新消息进行逐个处理。
优选地,所述更新消息使用http请求,采用json格式传输。
根据本发明,提供一种云搜索服务系统中的搜索方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引目录、站点资源索引和站点资源,所述站点资源包括标准化内容,该方法包括以下步骤:
站点响应用户的搜索请求发送搜索请求参数至云服务端,所述搜索请求参数包括站点域名、搜索关键字;
所述云服务端根据所述站点域名得到所述站点的资源索引的目录,进而获取其存储的所述站点的资源索引;
所述云服务端根据所述搜索关键字,在其存储的所述站点的资源索引中进行匹配查询,;
若匹配到一条或多条资源索引,所述云服务端获取所述一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中的一个或多个返回至所述站点;
若没有匹配到资源索引,则所述云服务端返回报错信息至所述站点;
所述站点将云服务端返回的搜索结果显示给用户。
优选地,所述云服务端根据所述搜索关键字在其存储的所述站点的系统默认类型的资源索引中进行匹配查询。
优选地,所述搜索请求参数进一步包括资源类型,所述云服务端根据所述搜索关键字在其存储的所述站点的所述资源类型的资源索引中进行匹配查询。
优选地,所述方法进一步包括,所述云服务端对搜索结果中的关键字做高亮处理。
根据本发明,提供一种云搜索服务系统中的搜索方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引的目录、站点资源索引、站点资源,以及所有站点的总资源索引,所述站点资源包括标准化内容,该方法包括以下步骤:
站点响应用户的搜索请求发送搜索请求参数至云服务端,所述搜索请求参数包括站点域名和搜索关键字;
所述云服务端根据所述站点域名得到所述站点的资源索引的目录,进而获取其存储的所述站点的资源索引;
所述云服务端根据所述搜索关键字,在其存储的所述站点的资源索引中进行匹配查询;
若匹配到多于预定数量的一条或多条资源索引,所述云服务端获取所述一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中的一个或多个返回至所述站点;
若匹配到不多于预定数量的资源索引,所述云服务端根据所述搜索关键字在其存储的总资源索引中再次进行匹配查询;
若匹配到一条或多条资源索引,云服务端获取所述一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中的一个或多个返回至所述站点;
若没有匹配到的资源索引,则云服务端返回报错信息至所述站点;
所述站点将云服务端返回的搜索结果显示给用户。
优选地,所述云服务端根据所述搜索关键字在其存储的所述站点的系统默认类型的资源索引中进行匹配查询。
优选地,所述搜索请求参数进一步包括资源类型,所述云服务端根据所述搜索关键字在其存储的所述站点的所述资源类型的资源索引中进行匹配查询。
根据本发明,提供一种云搜索服务系统,该云搜索服务系统包括云服务端以及多个站点,其中,所述站点包括:
发送装置,用于将注册申请、更新消息以及搜索请求参数发送至云服务端;
接收装置,用于接收来自所述云服务端的搜索结果;
显示装置,用于将所述搜索结果显示给用户;
所述云服务端包括:
数据采集装置,用于采集各站点的资源;
接收装置,用于接收自各站点发送的注册申请、更新消息以及搜索请求参数;
索引生成装置,用于在各站点的资源的基础上为各站点生成资源索引;
ID分配装置,用于根据所述注册申请为各站点分配站点ID;
目录生成装置,用于根据各站点ID建立各站点的资源索引的目录;
存储装置,用于存储各站点的注册申请、站点ID、资源索引的目录、资源以及资源索引;
更新装置,用于根据来自各站点的更新消息更新各站点的资源索引;
搜索装置,用于根据来自各站点的搜索请求参数进行搜索,并返回搜索结果至相应站点。
优选地,所述站点进一步包括资源标准化内容接口,用于当云服务端采集站点资源时提供资源的标准化内容。
优选地,所述云服务端进一步包括消息队列,用于存放来自各站点的更新消息。
优选地,所述索引生成装置还用于在所有站点的资源的基础上生成总资源索引;所述存储装置还用来存储所述总资源索引。
本发明的有益效果在于:
1、本发明区别于现有的站点所常用的站内搜索方法,使得站点无需考虑资源索引存储以及其他搜索技术细节,能够近乎零成本地实现站内搜索功能,缩减了建站开支和维护成本。
2、通过本发明,能有效地聚合多个站点的资源索引,当用户在站点进行站内搜索时,该站点不仅能够将本站点的相关资源呈现给用户,必要时还能够将注册入云服务端的所有联盟站点的相关资源也呈现给用户,满足不同用户的需求,使得搜索结果多样化,并且增加了站点的访问入口,提高了站点的访问量。
3、通过本发明,云服务端能实时准确地更新各站点的资源索引,从而为各站点提供最新的搜索结果。
4、通过本发明,云服务端可根据需求实现对多种类型资源的搜索服务,例如对词条、图片、文章、视频等资源的搜索服务。
5、本发明所请求保护的云服务端可提供分布式搜索服务,即使站点的数量较多且资源索引存储量过大,也能保证搜索服务的可靠性、可用性和扩展性。
附图说明
图1示出根据本发明实施例的云搜索服务注册方法流程图。
图2示出根据本发明实施例的一种云搜索服务系统中的云服务端的站点资源索引更新方法。
图3示出根据本发明实施例的云搜索服务系统中的搜索方法流程图。
图4示出根据本发明另一个实施例的云搜索服务系统中的搜索方法流程图。
图5示出根据本发明实施例云搜索服务系统结构示意图。
图6示出根据本发明实施例的云搜索服务系统中的站点的结构示意图。
图7示出根据本发明实施例的云搜索服务系统中的云服务端的结构示意图。
具体实施方式
本发明提供一种云搜索服务的实现方法。下面将结合附图对本发明的具体实施方式做详细说明。
图1示出根据本发明实施例的云搜索服务注册方法流程图。具体包括以下步骤:
在步骤S11中,站点发送注册申请至云服务端。
在本实施例中,所述注册申请包括站点域名,除此之外还可以包括站点名称和/或站点状态等。
在步骤S12中,所述云服务端根据所述注册申请为所述站点分配站点ID,并根据所述站点ID建立所述站点的资源索引的目录。
在本实施例中,建立站点资源索引的目录可以采用多级目录的方式。例如假设站点数量为100万个,可设2级目录,第一级目录1000个,第二级目录也是1000个。建立规则如下:先建立1000个一级目录,其目录名称为:0、1 、2 、3、……、999;再建立二级目录,其目录名称为站点ID。
所述站点的资源索引存放的目录按照站点ID mod 1000确定,例如,站点ID分别是1、2、3、4、1000、1000000,其分别对应的一级目录名称就分别是: 1,2, 3, 4,0,1000;也就是说,如果一个站点ID为1,那么该站点的内容索引存放的目录就是 1/1,如果一个站点的站点ID为98,那么该站点的内容索引存放的目录就是 98/98,如果一个站点ID为204386,那么该站点的内容索引存放的目录就是 386/204386。
在本实施例中,每个站点的注册申请、站点ID、站点资源索引的目录以一一对应的方式存储在云服务端。
在步骤S13中,所述云服务端采集所述站点的资源并存储,根据所述站点资源生成站点资源索引。
在本实施例中,所述云服务端通过站点提供的资源标准化内容接口采集所述站点的资源,采集到的站点资源包括标准化内容,该标准化内容包括资源访问地址、资源ID、资源名称、资源分类、资源正文、资源最后修改时间,此外,还可以进一步包括资源标签、资源摘要、资源作者ID、资源作者、资源创建时间、浏览量、资源编辑次数和版本数、资源评论数等。在本实施例中,所述站点提供的资源标准化内容接口采用XML语言编写,并对每个资源有独立的资源访问地址。通过该资源访问地址,云服务端可获取每个资源的标准化内容。
站点资源索引是云服务端在其采集并存储的站点资源的标准化内容的基础上生成的,生成的每条资源索引均对应一个或多个资源的标准化内容。资源索引的具体生成方式是现有技术所公知的,不是本发明所讨论的重点。
在步骤S14中,云服务端根据所述站点资源索引的目录定义的位置存储所述站点资源索引。在本实施例中,云服务端对每个站点均有一个独立的位置存储该站点的资源索引,该位置通过步骤S12中所建立的目录定义。
在上述步骤S13~S14中,若站点还没有建立过任何资源,则云服务端采集和存储的资源数为零,生成的资源索引数也为零。
上述步骤S11~S14中所指的资源,是词条、文章、图片和视频中的至少一种。
通过上述步骤S11~S14,云搜索服务注册完成,云搜索服务端对该站点启动服务。
图2示出根据本发明实施例的一种云搜索服务系统中的云服务端的站点资源索引更新方法。在本实施例中,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引的目录、站点资源索引以及站点资源。所述云服务端的站点资源索引更新方法具体包括如下步骤:
在步骤S21中,站点响应用户对站点资源所做的编辑,发送更新消息至云服务端,所述更新消息包括站点域名、资源访问地址、资源类型和编辑模式。
所述资源类型为词条类型、文章类型、图片类型和视频类型中的一种,所述编辑模式为创建、修改、删除、恢复中的一种。在本实施例中,所述更新消息还可以包括站点名称等。
例如,当用户对站点完成了一个词条编辑时,站点发送更新消息至云服务端,该更新消息中包括站点名称、站点域名、资源访问地址、资源类型和编辑模式,其中,资源访问地址为该词条的访问地址,资源类型为词条类型,例如用“doc”定义,编辑模式为修改,例如用“1”定义。在本实施例中,所述更新消息可以使用http请求,参数采用json格式,例如:
json={siteName: MyHDwiki,
siteUrl: http: //www.example.com/hdwikiutf8,
url: http:// www.example.com/hdwikiutf8/index.php?archiver-view-6349,
type: doc,
mode: 1
}。
在本实施例中,云服务端接收到自站点发送的更新消息后,可以直接处理。也可以将其放入消息队列,通过监听消息队列,对消息进行逐个处理,这样做的好处是能异步处理更新,减轻服务器的压力。
在步骤S22中,所述云服务端调用所述资源访问地址,以获取所述站点资源。
在本实施例中,所述站点资源包括标准化内容,该标准化内容包括资源访问地址、资源ID、资源名称、资源分类、资源正文、资源最后修改时间,此外,还可以进一步包括资源标签、资源摘要、资源作者ID、资源作者、资源创建时间、浏览量、资源编辑次数和版本数、资源评论数等。例如,云服务端通过站点发来的更新消息中包括的词条访问地址,获取词条的标准化内容,包括:词条ID、词条名称、词条分类、词条正文、词条最后修改时间,此外,还可以进一步包括词条标签、词条摘要、词条作者ID、词条作者、词条创建时间、浏览量、词条编辑次数和版本数、词条评论数等。
在步骤S23中,所述云服务端根据所述站点域名和资源类型得到其存储的所述站点的该类型的资源和资源索引的目录,进而获取其存储的所述站点的该类型的资源索引。
由于在图1所示的注册方法中,每个站点的站点域名、站点ID以及资源索引的目录以一一对应的方式存储在云服务端,因此,云服务端根据所述站点域名可以得到所述站点的资源索引的目录,进而获取其存储的所述站点的资源和资源索引。
在步骤S24中,所述云服务端利用其获取的站点资源,根据所述编辑模式更新其存储的所述站点的该类型的资源,并根据更新后的站点资源更新其存储的站点资源索引。
在本实施例中,当编辑模式为“创建模式”时,则将步骤S22中获取到的站点资源标准化内容格式化后新增至其存储的该站点的资源;当编辑模式为“修改模式”时,则用步骤S22中获取到的站点资源标准化内容格式化后覆盖其存储的该站点资源;当编辑模式为“删除模式”时,则将其存储的该站点资源作逻辑删除操作;当编辑模式为“恢复模式”时,则对该站点资源的存储作恢复操作。
下面说明云服务端如何为站点提供搜索服务。图3示出了根据本发明一个实施例的一种云搜索服务系统中的搜索方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引目录、站点资源索引和站点资源,所述站点资源包括标准化内容。具体包括以下步骤:
在步骤S31中,站点响应用户的搜索请求发送搜索请求参数至云服务端。所述搜索请求参数包括站点域名、搜索关键字和/或资源类型。
在本实施例中,若用户在搜索时没有指定资源类型,则所述搜索请求参数仅包括站点域名和搜索关键字;若用户在搜索时指定了资源类型,则所述搜索请求参数中除了包括站点域名和搜索关键字,还包括资源类型,该资源类型是词条类型、文章类型、图片类型和视频类型中的一种。此外,所述搜索请求参数中还可以包括站点名称等。
在本实施例中,该搜索请求参数中还可以包括站点名称等其他与搜索有关的信息。
例如当用户在站点MyHDwiki对关键词“China”进行搜索时,站点发送包括站点名称、站点域名、搜索关键字和资源类型的搜索请求参数至云服务端。在本实施例中,依然采用json格式的传输参数方式:
json={siteName:MyHDwiki,
siteUrl:http:// www.example.com /hdwiki50utf8,
query:China,
type: doc
}
在步骤S32中,所述云服务端根据所述站点域名得到所述站点的资源索引的目录,进而获取其存储的所述站点的资源索引。
由于在图1所示注册方法中,站点的站点域名、站点ID以及资源索引的目录是以一一对应的方式存储在云服务端的,因此,云服务端根据所述站点域名可以得到所述站点的资源索引的目录,进而获取其存储的所述站点的资源索引。
在步骤S33中,所述云服务端根据搜索关键字在其存储的资源索引中进行匹配查询。
在本发明实施例中,当来自站点的搜索请求参数中不包括资源类型,则云服务端既可以根据搜索关键字在其存储的该站点的全部资源索引中进行匹配查询,也可以根据搜索关键字在其存储的系统默认类型的资源索引中进行匹配查询;若来自站点的搜索请求参数中包括资源类型,则云服务端根据搜索关键字在其存储的所述资源类型的资源索引中进行匹配查询。
若匹配到一条或多条资源索引,进入步骤S34:云服务端获取所述一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中一个或多个作为搜索结果返回站点。在本实施例中,云服务端可以将上述搜索结果直接返回至站点,也可以将搜索结果中的关键字做高亮处理后再返回至所述站点。
若没有匹配到的资源索引,则进入步骤S35:云服务端返回报错信息至站点。
在步骤S36中:所述站点将云服务端返回的搜索结果显示给用户。在本实施例中,站点将搜索结果形成html显示给用户。
图4示出了根据本发明另一个实施例的一种云搜索服务系统中的搜索方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点的资源索引的目录、资源索引、资源,以及所有站点的总资源索引,所述站点资源包括标准化内容。具体包括以下步骤:
在步骤S41中,站点响应用户的搜索请求发送搜索请求参数至云服务端。所述搜索请求参数包括站点域名、搜索关键字和/或资源类型。
该步骤的具体实施方式可参考图3所示的另一个搜索方法的步骤S31。
在步骤S42中,所述云服务端根据所述站点域名得到所述站点的资源索引的目录,进而获取其存储的所述站点的资源索引。
该步骤的具体实施方式可参考图3所示的另一个搜索方法的步骤S32。
在步骤S43中,所述云服务端根据所述搜索关键字在其存储的所述站点的资源索引中进行匹配查询。具体实施方式可参考图3所示的另一个搜索方法的步骤S33。
若匹配到多于预定数量的一条或多条资源索引,进入步骤S44:云服务端获取所述一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中的一个或多个返回至所述站点。在本实施例中,云服务端可以将上述搜索结果直接返回至站点,也可以将搜索结果中的关键字做高亮处理后再返回至所述站点。
若匹配到不多于预定数量的资源索引,则进入步骤S45:所述云服务端根据所述搜索关键字在其总资源索引中再次进行匹配查询。
若匹配到一条或多条资源索引,进入步骤S46:云服务端获取该一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中的一个或多个返回至所述站点。在本实施例中,云服务端可以将上述搜索结果直接返回至站点,也可以将搜索结果中的关键字做高亮处理后再返回至所述站点。
若没有匹配到的资源索引,则进入步骤S47:云服务端返回报错信息至所述站点。
在步骤S48中,所述站点将云服务端返回的搜索结果显示给用户。在本实施例中,站点将搜索结果形成html显示给用户。
图5示出根据本发明实施例的云搜索服务系统的结构示意图。如图5所示,本发明所述的云搜索服务系统包括云服务端和多个站点。
图6示出根据本发明实施例的云搜索服务系统中的站点的结构示意图。云搜索服务系统中的每个站点均包括以下部分:
发送装置,用于将注册申请、更新消息以及搜索请求参数发送至云服务端;接收装置,用于接收来自云服务端的搜索结果;显示装置,用于将所述搜索结果显示给用户。此外还包括资源标准化内容接口,用于当云服务端采集站点资源时提供资源的标准化内容。
图7示出根据本发明实施例的云搜索服务系统中的云服务端的结构示意图。云服务端具体包括以下部分:
数据采集装置,用于采集各站点的资源;接收装置,用于接收自各站点发送的注册申请、更新消息以及搜索请求参数;索引生成装置,用于在各站点的资源的基础上为各站点生成资源索引;ID分配装置,用于根据来自站点的注册申请为各站点分配站点ID;目录生成装置,用于根据各站点ID建立各站点的资源索引的目录;存储装置,用于存储各站点的注册申请、站点ID、资源索引的目录、资源以及资源索引;更新装置,用于根据来自各站点的更新消息更新各站点的资源索引;搜索装置,用于根据来自各站点的搜索请求参数进行搜索,并返回搜索结果至相应站点。
在本发明实施例中,云服务端还可以进一步包括消息队列,用于存放来自各站点的更新消息。
在本发明实施例中,云服务端中的索引生成装置还用于在所有站点的资源的基础上生成总资源索引;云服务端中的存储装置还用于存储所述总资源索引。
应当理解,以上借助本发明的优选实施例对本发明的技术方案进行了详细说明。本领域的普通技术人员在阅读本发明说明书的基础上可以对实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。本发明的保护范围仅由随附权利要求书限定。

Claims (26)

1.一种云搜索服务注册方法,该方法包括以下步骤:
站点发送注册申请至云服务端,所述注册申请至少包括站点域名;
所述云服务端根据所述注册申请为所述站点分配站点ID,并根据所述站点ID建立所述站点的资源索引的目录;
所述云服务端采集所述站点的资源并存储,根据所述站点资源生成站点资源索引;
所述云服务端根据所述站点资源索引的目录定义的位置存储所述站点资源索引。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括,云服务端将所述站点的注册申请、站点ID以及站点资源索引的目录以一一对应的方式存储。
3.根据权利要求1或2所述的方法,其特征在于,所述注册申请还包括站点名称和/或站点状态。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括,所述云服务端在其存储的所有站点的资源的基础上生成总资源索引。
5.根据权利要求1或2所述的方法,其特征在于,所述目录采用多级目录的方式建立。
6.根据权利要求1所述的方法,其特征在于,所述云服务端采集所述站点的资源并存储包括:
所述云服务端通过所述站点提供的资源标准化内容接口采集所述站点的资源,所述站点资源包括标准化内容,所述标准化内容包括资源访问地址、资源ID、资源名称、资源分类、资源正文和资源最后修改时间;
所述云服务端存储所述资源的标准化内容。
7.根据权利要求6所述的方法,所述资源的标准化内容还包括资源标签、资源摘要、资源作者ID、资源作者、资源创建时间、资源浏览量、资源编辑次数、资源版本数和资源评论数中的至少一个。
8.根据权利要求6所述的方法,其特征在于,所述站点提供的资源标准化内容接口采用XML语言编写,并对每个资源有独立的资源访问地址。
9.根据权利要求1所述的方法,其特征在于,所述资源为词条、文章、图片和视频中的至少一种。
10.一种云搜索服务系统中的云服务端的站点资源索引更新方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引的目录、站点资源索引以及站点资源,其特征在于,该方法包括以下步骤:
站点响应用户对站点资源所做的编辑,发送更新消息至云服务端,所述更新消息包括站点域名、资源访问地址、资源类型和编辑模式;
所述云服务端调用所述资源访问地址,以获取所述站点资源;
所述云服务端根据所述站点域名和资源类型得到其存储的所述站点的该类型的资源和资源索引的目录,进而获取其存储的所述站点的该类型的资源索引;
所述云服务端利用其获取的站点资源,根据所述编辑模式更新其存储的所述站点的该类型的资源,并根据更新后的站点资源更新其存储的站点资源索引。
11.根据权利要求10所述的方法,其特征在于,所述资源类型为词条类型、文章类型、图片类型和视频类型中的一种;所述编辑模式为创建、修改、删除和恢复中的一种。
12.根据权利要求10所述的方法,其特征在于,所述站点资源包括标准化内容,所述标准化内容包括资源访问地址、资源ID、资源名称、资源分类、资源正文和资源最后修改时间。
13.根据权利要求12所述的方法,其特征在于,所述资源的标准化内容还包括资源标签、资源摘要、资源作者ID、资源作者、资源创建时间、资源浏览量、资源编辑次数、资源版本数和资源评论数中的至少一个。
14.根据权利要求10所述的方法,其特征在于,所述方法进一步包括,所述云服务端接收自所述站点发送的更新消息,将其放入消息队列,通过监听消息队列,对所述更新消息进行逐个处理。
15.根据权利要求10所述的方法,其特征在于,所述更新消息使用http请求,采用json格式传输。
16.一种云搜索服务系统中的搜索方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引目录、站点资源索引和站点资源,所述站点资源包括标准化内容,其特征在于,该方法包括以下步骤:
站点响应用户的搜索请求发送搜索请求参数至云服务端,所述搜索请求参数包括站点域名、搜索关键字;
所述云服务端根据所述站点域名得到所述站点的资源索引的目录,进而获取其存储的所述站点的资源索引;
所述云服务端根据所述搜索关键字,在其存储的所述站点的资源索引中进行匹配查询,;
若匹配到一条或多条资源索引,所述云服务端获取所述一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中的一个或多个返回至所述站点;
若没有匹配到资源索引,则所述云服务端返回报错信息至所述站点;
所述站点将云服务端返回的搜索结果显示给用户。
17.根据权利要求16所述的方法,其特征在于,所述云服务端根据所述搜索关键字在其存储的所述站点的系统默认类型的资源索引中进行匹配查询。
18.根据权利要求16所述的方法,其特征在于,所述搜索请求参数进一步包括资源类型,所述云服务端根据所述搜索关键字在其存储的所述站点的所述资源类型的资源索引中进行匹配查询。
19.根据权利要求16所述的方法,其特征在于,所述方法进一步包括,所述云服务端对搜索结果中的关键字做高亮处理。
20.一种云搜索服务系统中的搜索方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引的目录、站点资源索引、站点资源,以及所有站点的总资源索引,所述站点资源包括标准化内容,其特征在于,该方法包括以下步骤:
站点响应用户的搜索请求发送搜索请求参数至云服务端,所述搜索请求参数包括站点域名和搜索关键字;
所述云服务端根据所述站点域名得到所述站点的资源索引的目录,进而获取其存储的所述站点的资源索引;
所述云服务端根据所述搜索关键字,在其存储的所述站点的资源索引中进行匹配查询;
若匹配到多于预定数量的一条或多条资源索引,所述云服务端获取所述一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中的一个或多个返回至所述站点;
若匹配到不多于预定数量的资源索引,所述云服务端根据所述搜索关键字在其存储的总资源索引中再次进行匹配查询;
若匹配到一条或多条资源索引,云服务端获取所述一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中的一个或多个返回至所述站点;
若没有匹配到的资源索引,则云服务端返回报错信息至所述站点;
所述站点将云服务端返回的搜索结果显示给用户。
21.根据权利要求20所述的方法,其特征在于,所述云服务端根据所述搜索关键字在其存储的所述站点的系统默认类型的资源索引中进行匹配查询。
22.根据权利要求20所述的方法,其特征在于,所述搜索请求参数进一步包括资源类型,所述云服务端根据所述搜索关键字在其存储的所述站点的所述资源类型的资源索引中进行匹配查询。
23.一种云搜索服务系统,该云搜索服务系统包括云服务端以及多个站点,其特征在于,所述站点包括:
发送装置,用于将注册申请、更新消息以及搜索请求参数发送至云服务端;
接收装置,用于接收来自所述云服务端的搜索结果;
显示装置,用于将所述搜索结果显示给用户;
所述云服务端包括:
数据采集装置,用于采集各站点的资源;
接收装置,用于接收自各站点发送的注册申请、更新消息以及搜索请求参数;
索引生成装置,用于在各站点的资源的基础上为各站点生成资源索引;
ID分配装置,用于根据所述注册申请为各站点分配站点ID;
目录生成装置,用于根据各站点ID建立各站点的资源索引的目录;
存储装置,用于存储各站点的注册申请、站点ID、资源索引的目录、资源以及资源索引;
更新装置,用于根据来自各站点的更新消息更新各站点的资源索引;
搜索装置,用于根据来自各站点的搜索请求参数进行搜索,并返回搜索结果至相应站点。
24.根据权利要求23所述的云搜索服务系统,其特征在于,所述站点进一步包括资源标准化内容接口,用于当云服务端采集站点资源时提供资源的标准化内容。
25.根据权利要求23所述的云搜索服务系统,其特征在于,所述云服务端进一步包括消息队列,用于存放来自各站点的更新消息。
26.根据权利要求23所述的云搜索服务系统,其特征在于,所述索引生成装置还用于在所有站点的资源的基础上生成总资源索引;所述存储装置还用来存储所述总资源索引。
CN 201110144818 2011-05-31 2011-05-31 一种实现云搜索服务的方法及系统 Active CN102164186B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110144818 CN102164186B (zh) 2011-05-31 2011-05-31 一种实现云搜索服务的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110144818 CN102164186B (zh) 2011-05-31 2011-05-31 一种实现云搜索服务的方法及系统

Publications (2)

Publication Number Publication Date
CN102164186A true CN102164186A (zh) 2011-08-24
CN102164186B CN102164186B (zh) 2013-10-30

Family

ID=44465152

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110144818 Active CN102164186B (zh) 2011-05-31 2011-05-31 一种实现云搜索服务的方法及系统

Country Status (1)

Country Link
CN (1) CN102164186B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102508884A (zh) * 2011-10-18 2012-06-20 盘古文化传播有限公司 热点事件与实时评论的获取方法及装置
CN102902578A (zh) * 2012-09-28 2013-01-30 方正国际软件有限公司 基于动词表达式的云端服务目录系统
WO2013060065A1 (zh) * 2011-10-27 2013-05-02 北京百度网讯科技有限公司 一种根据用户设备的终端属性提供目标信息的方法与设备
CN103207818A (zh) * 2013-04-23 2013-07-17 互动在线(北京)科技有限公司 一种基于草稿箱的词条编辑备份方法和草稿箱系统
CN103312734A (zh) * 2012-03-08 2013-09-18 中兴通讯股份有限公司 壁纸推送方法及装置
CN103745004A (zh) * 2014-01-24 2014-04-23 中国联合网络通信集团有限公司 一种基于云计算的桌面搜索方法、云服务器及终端
CN104331511A (zh) * 2014-11-24 2015-02-04 飞狐信息技术(天津)有限公司 静态页面更新方法及装置
CN104461736A (zh) * 2014-12-08 2015-03-25 畅捷通信息技术股份有限公司 资源分配与搜索方法、资源分配与搜索系统和云服务器
CN105991660A (zh) * 2015-01-27 2016-10-05 杭州海康威视系统技术有限公司 一种多云存储系统间资源共享的系统
CN108009235A (zh) * 2017-11-29 2018-05-08 福建中金在线信息科技有限公司 数据获取方法及装置
CN108353263A (zh) * 2015-10-30 2018-07-31 Lg 电子株式会社 处理无线通信系统中的服务请求的方法及其设备
CN109960695A (zh) * 2019-04-09 2019-07-02 苏州浪潮智能科技有限公司 云计算系统中数据库的管理方法和装置
CN111026911A (zh) * 2018-10-10 2020-04-17 武汉斗鱼网络科技有限公司 直播间搜索引擎自适应调整方法、装置及可读存储介质
CN111475728A (zh) * 2020-04-07 2020-07-31 腾讯云计算(北京)有限责任公司 云资源信息搜索方法、装置、设备及存储介质
CN112579530A (zh) * 2020-12-14 2021-03-30 莱诺斯科技(北京)股份有限公司 一种自动化测试系统的数据资源组织方法及装置
WO2022252187A1 (en) * 2021-06-03 2022-12-08 Microsoft Technology Licensing, Llc Multi-region hybrid index management
CN117194439A (zh) * 2023-11-07 2023-12-08 杭州优云科技有限公司 一种资源存储系统的创建方法、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1890662A (zh) * 2003-09-29 2007-01-03 千兆科技(深圳)有限公司 内容定向的索引和搜索方法与系统
US20080082490A1 (en) * 2006-09-28 2008-04-03 Microsoft Corporation Rich index to cloud-based resources
CN101184016A (zh) * 2007-12-10 2008-05-21 华中科技大学 混杂式对等网络环境下的通用资源管理方法
CN101667187A (zh) * 2009-09-23 2010-03-10 南京邮电大学 一种基于对等计算技术的复合知识云方法
CN101969475A (zh) * 2010-11-15 2011-02-09 张军 基于云计算的商业数据可控分发与融合应用系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1890662A (zh) * 2003-09-29 2007-01-03 千兆科技(深圳)有限公司 内容定向的索引和搜索方法与系统
US20080082490A1 (en) * 2006-09-28 2008-04-03 Microsoft Corporation Rich index to cloud-based resources
CN101184016A (zh) * 2007-12-10 2008-05-21 华中科技大学 混杂式对等网络环境下的通用资源管理方法
CN101667187A (zh) * 2009-09-23 2010-03-10 南京邮电大学 一种基于对等计算技术的复合知识云方法
CN101969475A (zh) * 2010-11-15 2011-02-09 张军 基于云计算的商业数据可控分发与融合应用系统

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102508884A (zh) * 2011-10-18 2012-06-20 盘古文化传播有限公司 热点事件与实时评论的获取方法及装置
WO2013060065A1 (zh) * 2011-10-27 2013-05-02 北京百度网讯科技有限公司 一种根据用户设备的终端属性提供目标信息的方法与设备
CN103312734A (zh) * 2012-03-08 2013-09-18 中兴通讯股份有限公司 壁纸推送方法及装置
CN102902578B (zh) * 2012-09-28 2016-03-30 方正国际软件有限公司 基于动词表达式的云端服务目录系统
CN102902578A (zh) * 2012-09-28 2013-01-30 方正国际软件有限公司 基于动词表达式的云端服务目录系统
CN103207818A (zh) * 2013-04-23 2013-07-17 互动在线(北京)科技有限公司 一种基于草稿箱的词条编辑备份方法和草稿箱系统
CN103207818B (zh) * 2013-04-23 2016-01-13 互动在线(北京)科技有限公司 一种基于草稿箱的词条编辑备份方法和草稿箱系统
CN103745004A (zh) * 2014-01-24 2014-04-23 中国联合网络通信集团有限公司 一种基于云计算的桌面搜索方法、云服务器及终端
CN103745004B (zh) * 2014-01-24 2017-09-22 中国联合网络通信集团有限公司 一种基于云计算的桌面搜索方法、云服务器及终端
CN104331511A (zh) * 2014-11-24 2015-02-04 飞狐信息技术(天津)有限公司 静态页面更新方法及装置
CN104331511B (zh) * 2014-11-24 2018-02-09 飞狐信息技术(天津)有限公司 静态页面更新方法及装置
CN104461736A (zh) * 2014-12-08 2015-03-25 畅捷通信息技术股份有限公司 资源分配与搜索方法、资源分配与搜索系统和云服务器
CN105991660A (zh) * 2015-01-27 2016-10-05 杭州海康威视系统技术有限公司 一种多云存储系统间资源共享的系统
CN105991660B (zh) * 2015-01-27 2020-05-08 杭州海康威视系统技术有限公司 一种多云存储系统间资源共享的系统
CN108353263A (zh) * 2015-10-30 2018-07-31 Lg 电子株式会社 处理无线通信系统中的服务请求的方法及其设备
US10721313B2 (en) 2015-10-30 2020-07-21 Lg Electronics Inc. Method for processing service request in wireless communication system and apparatus therefor
CN108353263B (zh) * 2015-10-30 2021-02-09 Lg 电子株式会社 处理无线通信系统中的服务请求的方法及其设备
CN108009235A (zh) * 2017-11-29 2018-05-08 福建中金在线信息科技有限公司 数据获取方法及装置
CN111026911A (zh) * 2018-10-10 2020-04-17 武汉斗鱼网络科技有限公司 直播间搜索引擎自适应调整方法、装置及可读存储介质
CN111026911B (zh) * 2018-10-10 2023-10-20 武汉斗鱼网络科技有限公司 直播间搜索引擎自适应调整方法、装置及可读存储介质
CN109960695A (zh) * 2019-04-09 2019-07-02 苏州浪潮智能科技有限公司 云计算系统中数据库的管理方法和装置
CN109960695B (zh) * 2019-04-09 2020-03-13 苏州浪潮智能科技有限公司 云计算系统中数据库的管理方法和装置
CN111475728A (zh) * 2020-04-07 2020-07-31 腾讯云计算(北京)有限责任公司 云资源信息搜索方法、装置、设备及存储介质
CN111475728B (zh) * 2020-04-07 2023-04-07 腾讯云计算(北京)有限责任公司 云资源信息搜索方法、装置、设备及存储介质
CN112579530A (zh) * 2020-12-14 2021-03-30 莱诺斯科技(北京)股份有限公司 一种自动化测试系统的数据资源组织方法及装置
WO2022252187A1 (en) * 2021-06-03 2022-12-08 Microsoft Technology Licensing, Llc Multi-region hybrid index management
CN117194439A (zh) * 2023-11-07 2023-12-08 杭州优云科技有限公司 一种资源存储系统的创建方法、电子设备及存储介质
CN117194439B (zh) * 2023-11-07 2024-03-22 杭州优云科技有限公司 一种资源存储系统的创建方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN102164186B (zh) 2013-10-30

Similar Documents

Publication Publication Date Title
CN102164186B (zh) 一种实现云搜索服务的方法及系统
CN100405371C (zh) 一种提取新词的方法和系统
CN102831253B (zh) 一种分布式全文检索系统
CN103678494A (zh) 客户端同步服务端数据的方法及装置
CN106250424A (zh) 一种日志上下文内容的搜索方法、装置及系统
EP1891557A2 (en) Learning facts from semi-structured text
CN103473696A (zh) 一种收集、分析和分发网络商业信息的方法和系统
CN103744856A (zh) 联动性扩展搜索方法及装置、系统
CN101464894A (zh) 数据查询方法和系统
Zhao et al. Topic-centric and semantic-aware retrieval system for internet of things
CN102710795A (zh) 热点聚合方法及装置
WO2009122160A1 (en) Electronic resource annotation
CN102651021A (zh) 一种图标内容更新方法及更新装置
CN103701929A (zh) 实现业务数据缓存的方法及装置
CN104298669A (zh) 一种基于社交网络的人员地理信息挖掘模型
CN102508884A (zh) 热点事件与实时评论的获取方法及装置
CN108900547A (zh) 回源控制方法及装置
JP6453464B2 (ja) 検索エンジンにウェブサイト認証データを提供するための方法及び装置
CN112256880A (zh) 文本识别方法和装置、存储介质及电子设备
CN103593345A (zh) 网页流程图编辑方法及系统
CN102541947A (zh) 一种用于基于扩展推荐事件更新网页权威值的方法与设备
CN102325143A (zh) 一种基于云平台的信息收集存储和加密检索系统
CN102945270A (zh) 并行化分布式网络舆情数据管理方法及系统
CN109739885A (zh) 基于本地缓存的数据查询方法、装置、设备及存储介质
CN108846002B (zh) 标签实时更新方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP03 Change of name, title or address

Address after: 100085 Haidian District on the road to information on the ground floor, building A7F, No. 28, Beijing

Patentee after: BEIJING HUDONG BAIKE NETWORK TECHNOLOGY CO.,LTD.

Address before: 100086, Crowne Plaza Zhongguancun Beijing, Haidian District, Beijing, 106, 8 floor, office building, Zhichun Road

Patentee before: Hudong Online (Beijing) Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100085 Haidian District on the road to information on the ground floor, building A7F, No. 28, Beijing

Patentee after: Beijing Interactive Encyclopedia Network Technology Co.,Ltd.

Address before: 100085 Haidian District on the road to information on the ground floor, building A7F, No. 28, Beijing

Patentee before: BEIJING HUDONG BAIKE NETWORK TECHNOLOGY CO.,LTD.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190924

Address after: 100041, room 2, building 3, building 30, Xing Xing street, Shijingshan District, Beijing,

Patentee after: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.

Address before: 100085 Haidian District on the road to information on the ground floor, building A7F, No. 28, Beijing

Patentee before: Beijing Interactive Encyclopedia Network Technology Co.,Ltd.