CN106021607A - 静态托管网站的管理方法和管理系统 - Google Patents

静态托管网站的管理方法和管理系统 Download PDF

Info

Publication number
CN106021607A
CN106021607A CN201610466057.XA CN201610466057A CN106021607A CN 106021607 A CN106021607 A CN 106021607A CN 201610466057 A CN201610466057 A CN 201610466057A CN 106021607 A CN106021607 A CN 106021607A
Authority
CN
China
Prior art keywords
static
memory space
trustship website
full
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610466057.XA
Other languages
English (en)
Inventor
吴兴义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Holding Beijing Co Ltd
LeTV Cloud Computing Co Ltd
Original Assignee
LeTV Holding Beijing Co Ltd
LeTV Cloud Computing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Holding Beijing Co Ltd, LeTV Cloud Computing Co Ltd filed Critical LeTV Holding Beijing Co Ltd
Priority to CN201610466057.XA priority Critical patent/CN106021607A/zh
Publication of CN106021607A publication Critical patent/CN106021607A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开提供的静态托管网站的管理方法和管理系统。该管理方法根据第一搜索引擎生成所述静态托管网站的全文索引,当接收静态托管网站的检索请求时,检索对应的文件索引,并根据检索结果组织HTML页面返回给所述客户端。由此,不需要大量的开发工作,即可实现静态托管网站的检索功能。

Description

静态托管网站的管理方法和管理系统
技术领域
本公开涉及云存储领域,具体涉及静态托管网站的检索方法和管理系统。
背景技术
对象存储在互联网的大潮中受到了广发关注,并得到了迅速的发展。对象存储与文件存储不同,对象不以目录分层的结构进行组织。每个对象都位于被称为存储池的扁平的空间的相同层级,每一级的每个元素在存储系统中都有唯一的标识,用户通过这个标识来访问容器或者对象。采用扁平的数据组织结构抛弃了嵌套的文件夹,避免维护庞大的目录树。在大数据和互联网时代,存储的文件/对象超过上百万个,单位时间内的访问次数和并发访问量也达到了前所未有的量级,在这种情况下,目录树会给存储系统带来很大的开销和诸多问题,成为系统的瓶颈。另外一个让对象存储焕发生命力的因素是,对象存储不再提供POSIX兼容的接口(如open,close,read,write等),而是可以非常方便地通过HTTPRestful API接口和对象进行交互:通过PUT和GET进行上传下载,通过DELETE进行删除。
在进行对象存储时,用户首先需要为对象申请一个存储空间(bucket),然后将对象上载到一个存储空间(bucket)中,供后续下载使用。静态网站托管是指用户在对象存储中创建了一个bucket之后,把这个bucket的ACL设置成public-read(任意可读),并将后续上传的每一个对象(通常都是html等静态网页)都设置成public-read,让用户能够非常方便的访问到部署于云存储上的静态网页内容,这就是所述的静态托管网站。
这种静态托管网站内容一般比较固定,起到基本的宣传作用,但是对于这种网站,检索文件内容通常比较麻烦,因为页面是静态,用户如果自己做检索系统的话,就需要引入一个后台管理系统,这就与用户需要的静态页面相违背了。
发明内容
有鉴于此,本公开提供一种静态托管网站的管理方法和管理系统,解决基于对象存储的静态托管网站的全文检索问题。
根据本公开的第一方面,本公开提供建立从客户端到云存储端的通信连接;根据第一搜索引擎生成所述静态托管网站的全文索引;接收所述静态托管网站的检索请求,所述检索请求中包括存储空间标识符和检索词;根据所述检索词检索所述存储空间标识符对应的全文索引;以及根据检索结果组织HTML页面返回给所述客户端,
其中,所述静态托管网站包括多个静态页面,所述多个静态页面存储在一个所述存储空间,所述存储空间标识符用于标识一个所述存储空间。
可选地,还包括:在所述静态托管网站修改时,重新生成所述全文索引。
可选地,所述第一搜索引擎为Elasticsearch搜索引擎。
可选地,所述检索请求为URL格式的字符串,所述字符串通过问号分隔所述静态托管网站的访问域名和所述检索词,所述访问域名中包含所述存储空间标识符。
可选地,还包括:根据所述客户端的请求,删除所述全文索引。
根据本公开的第二方面,本公开一种静态托管网站的管理系统,包括多个客户端和云存储端,所述云存储端包括:
和所述客户端建立通信连接;
从所述客户端接收所述静态托管网站的检索请求,所述检索请求中包括存储空间标识符和检索词;
根据第一搜索引擎生成所述静态托管网站的全文索引;
根据所述检索词检索所述存储空间标识符对应的全文索引;以及
根据检索结果组织HTML页面返回给所述客户端,
其中,所述静态托管网站包括多个静态页面,所述多个静态页面存储在一个所述存储空间,所述存储空间标识符用于标识一个所述存储空间。
可选地,所述云存储端还包括:在所述静态托管网站修改时,重新生成所述全文索引。
可选地,所述第一搜索引擎为Elasticsearch搜索引擎。
可选地,所述静态托管网站的检索请求为URL格式的字符串,所述字符串通过问号分隔所述静态托管网站的访问域名和所述检索词,所述访问域名中包含所述存储空间标识符。
可选地,所述云存储端还包括:根据所述客户端的请求,删除所述全文索引。
本公开提供的静态托管网站的管理方法和管理系统,根据第一搜索引擎生成所述静态托管网站的全文索引,当接收静态托管网站的检索请求时,检索对应的文件索引,并根据检索结果组织HTML页面返回给所述客户端。由此,不需要大量的开发工作,即可实现静态托管网站的检索功能。
附图说明
通过参照以下附图对本公开实施例的描述,本公开的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1是根据本公开实施例的静态托管网站的管理系统的示意图;
图2是根据本公开实施例的静态托管网站的管理方法的流程图;
图3是根据本公开实施例的客户端和云存储端建立通信连接的示意图。
具体实施方式
以下基于实施例对本公开进行描述,但是本公开并不仅仅限于这些实施例。在下文对本公开的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本公开。为了避免混淆本公开的实质,公知的方法、过程、流程没有详细叙述。另外附图不一定是按比例绘制的。
在本公开的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。
现有云存储技术中,可以将云存储端的一个存储空间设置为静态网站托管模式,并通过存储空间域名访问该静态网站。例如,用户设置了索引页面为index.html,错误页面为error.html,该静态托管网站存储在bucket1中,则访问该静态托管网站的方式类似:http://bucket1.xxx.xxx.com。
图1是根据本公开实施例的静态托管网站的管理系统的示意图。所述管理系统包括客户端100和云存储端101。这里,客户端可以是一个手机APP,或视频系统、电商系统的前端或后端程序。云存储端则可以包括软硬件结合的云服务系统。
这里,可以把云存储端101的存储区域看作一个网络SAN(StorageArea Network),即一个集中式管理的高速存储网络,由多供应商存储系统、存储管理软件、应用程序服务器和网络硬件组成。云存储端使用存储空间(bucket)和对象对数据进行存储。可以将bucket理解为容器,每个对象都存放在一个容器中,如图1中的102所示,云存储端将存储区域分为若干个bucket,每个bucket中存储有多个对象。bucket使用存储空间标识符作为唯一标识。
参考图1所示,102的bucket1中静态托管网站的静态页面。静态页面没有交互功能,只用于显示信息。因此,为了实现对静态托管网站的检索功能,通过搜索引擎实现对静态托管网站包含的静态页面进行检索。
具体实现为:云存储端通过搜索引擎创建一个静态托管网站的全文索引。当接收到客户端的检索请求时,从检索请求中提取检索词检索全文索引,并将检索结果HTML页面返回给客户端。进一步地,对静态托管网站的检索请求类似于:http://bucket1.xxx.xxx.com?检索词1:检索词2:检索词3。通过“?”分隔访问域名和多个检索词。进一步地,访问域名为bucket访问串。此外,这里所指的检索引擎类似Elasticsearch这种具有全文搜索的引擎,它基于RESTful web接口,适用于云计算的开发。
图2是根据本公开实施例的对象存储方法的流程图。所述对象存储方法包括步骤201-205。
在步骤201中,根据第一搜索引擎生成静态托管网站的全文索引。
在步骤202中,建立从客户端到云存储端的通信连接。
图3示出了一个手机APP和云存储端建立安全通信连接的过程。标记30为客户端,标记31为权限管理服务器,通过客户端访问权限管理服务器。当需要进行云端存储时,客户端通过步骤301向权限管理服务器发送一个云端授权请求,权限管理服务器接收后,向云存储端转发,云存储端进行校验后,返回临时授权ID或访问令牌(Access token),权限管理服务器接收到该授权ID或访问令牌,返回给客户端。客户端将该授权ID或访问令牌缓存在本地,并通过该授权ID或访问令牌和云存储端进行通信连接。为了保证授权ID或访问令牌不被滥用或窃取,该类授权ID或访问令牌一般都设有时间限制,过了预定时间自动失效。
在步骤203中,接收静态托管网站的检索请求,所述检索请求中包括存储空间标识符和检索词。
例如,http://bucket1.xxx.xxx.com?检索词1:检索词2:检索词3获得存储空间标识符bucket1和检索词1、检索词2和检索词3。
在步骤204中,根据检索词检索存储空间标识符对应的全文索引。
例如,根据上述的bucket1找到静态托管网站的存储空间以及其对应的全文索引,在全文索引中查找检索词。全文索引把内容根据词的意义进行分词,然后分别创建索引。例如Elasticsearch搜索引擎使用的第三方的分词器:ik分词器、mmsegf分词器和paoding分词器。通过索引找到分词所在的对象,以及该分词在对象中出现的位置、出现的次数等信息。
在步骤205中,根据检索结果组织HTML页面返回给客户端。
本公开提供的方法,能够检索一个设置静态托管网站的网站内容,通过搜索引擎生成静态托管网站的全文索引,如果客户端提交检索请求,即从全文索引中查找。由此,不需要大量的开发工作,即可实现静态托管网站的检索功能。
由于全文索引为静态索引,如果静态托管网站的静态页面发生修改时,需要重新生成全文索引。在静态托管网站关闭全文检索功能时,则需要删除对应的全文检索。
本公开提供的静态托管网站的检索方法和系统,基于静态托管网站在云存储端的存储方式,通过搜索引擎实现检索功能。另外,可以控制静态托管网站的检索功能的关闭和开发。此实现方便,迅捷,节约了人力资源。
附图中的流程图、框图图示了本公开实施例的系统、方法、装置的可能的体系框架、功能和操作,流程图和框图上的方框可以代表一个、程序段或仅仅是一段代码,所述、程序段和代码都是用来实现规定逻辑功能的可执行指令。也应当注意,所述实现规定逻辑功能的可执行指令可以重新组合,从而生成新的和程序段。因此附图的方框以及方框顺序只是用来更好的图示实施例的过程和步骤,而不应以此作为对发明本身的限制。
系统的各个或单元可以通过硬件、固件或软件实现。软件例如包括采用JAVA、C/C++/C#、SQL等各种编程语言形成的编码程序。虽然在方法以及方法图例中给出本公开实施例的步骤以及步骤的顺序,但是所述步骤实现规定的逻辑功能的可执行指令可以重新组合,从而生成新的步骤。所述步骤的顺序也不应该仅仅局限于所述方法以及方法图例中的步骤顺序,可以根据功能的需要随时进行调整。例如将其中的某些步骤并行或按照相反顺序执行。
根据本公开的系统和方法可以部署在单个或多个服务器上。例如,可以将不同的分别部署在不同的服务器上,形成专用服务器。或者,可以在多个服务器上分布式部署相同的功能单元、或系统,以减轻负载压力。所述服务器包括但不限于在同一个局域网以及通过Internet连接的多个PC机、PC服务器、刀片机、超级计算机等。
以上所述仅为本公开的优选实施例,并不用于限制本公开,对于本领域技术人员而言,本公开可以有各种改动和变化。凡在本公开的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (10)

1.一种静态托管网站的管理方法,包括:
建立从客户端到云存储端的通信连接;
根据第一搜索引擎生成所述静态托管网站的全文索引;
接收所述静态托管网站的检索请求,所述检索请求中包括存储空间标识符和检索词;
根据所述检索词检索所述存储空间标识符对应的全文索引;以及
根据检索结果组织HTML页面返回给所述客户端,
其中,所述静态托管网站包括多个静态页面,所述多个静态页面存储在一个所述存储空间,所述存储空间标识符用于标识一个所述存储空间。
2.根据权利要求1所述的管理方法,还包括:在所述静态托管网站修改时,重新生成所述全文索引。
3.根据权利要求1或2所述的管理方法,其中,所述第一搜索引擎为Elasticsearch搜索引擎。
4.根据权利要求1所述的管理方法,其中,所述检索请求为URL格式的字符串,所述字符串通过问号分隔所述静态托管网站的访问域名和所述检索词,所述访问域名中包含所述存储空间标识符。
5.根据权利要求1所述的管理方法,还包括:根据所述客户端的请求,删除所述全文索引。
6.一种静态托管网站的管理系统,包括多个客户端和云存储端,
所述云存储端包括:
和所述客户端建立通信连接;
从所述客户端接收所述静态托管网站的检索请求,所述检索请求中包括存储空间标识符和检索词;
根据第一搜索引擎生成所述静态托管网站的全文索引;
根据所述检索词检索所述存储空间标识符对应的全文索引;以及
根据检索结果组织HTML页面返回给所述客户端,
其中,所述静态托管网站包括多个静态页面,所述多个静态页面存储在一个所述存储空间,所述存储空间标识符用于标识一个所述存储空间。
7.根据权利要求6所述的管理系统,所述云存储端还包括:在所述静态托管网站修改时,重新生成所述全文索引。
8.根据权利要求6或7所述的管理系统,其中,所述第一搜索引擎为Elasticsearch搜索引擎。
9.根据权利要求6所述的管理系统,其中,所述静态托管网站的检索请求为URL格式的字符串,所述字符串通过问号分隔所述静态托管网站的访问域名和所述检索词,所述访问域名中包含所述存储空间标识符。
10.根据权利要求6所述的管理系统,所述云存储端还包括:根据所述客户端的请求,删除所述全文索引。
CN201610466057.XA 2016-06-23 2016-06-23 静态托管网站的管理方法和管理系统 Pending CN106021607A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610466057.XA CN106021607A (zh) 2016-06-23 2016-06-23 静态托管网站的管理方法和管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610466057.XA CN106021607A (zh) 2016-06-23 2016-06-23 静态托管网站的管理方法和管理系统

Publications (1)

Publication Number Publication Date
CN106021607A true CN106021607A (zh) 2016-10-12

Family

ID=57087267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610466057.XA Pending CN106021607A (zh) 2016-06-23 2016-06-23 静态托管网站的管理方法和管理系统

Country Status (1)

Country Link
CN (1) CN106021607A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102577237A (zh) * 2010-12-20 2012-07-11 华为技术有限公司 网站托管服务调度方法、应用访问处理方法、装置及系统
CN103514555A (zh) * 2013-03-29 2014-01-15 洛阳中创网络技术服务有限公司 一种企业网站托管方法
US20140122663A1 (en) * 2012-10-31 2014-05-01 Brown Paper Tickets Llc Overload protection based on web traffic volumes
CN104981802A (zh) * 2013-02-27 2015-10-14 日立数据系统有限公司 针对对象存储器索引系统的内容类别
CN105631050A (zh) * 2016-03-01 2016-06-01 国家计算机网络与信息安全管理中心 一种基于规则配置的url搜索关键词提取的方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102577237A (zh) * 2010-12-20 2012-07-11 华为技术有限公司 网站托管服务调度方法、应用访问处理方法、装置及系统
US20140122663A1 (en) * 2012-10-31 2014-05-01 Brown Paper Tickets Llc Overload protection based on web traffic volumes
CN104981802A (zh) * 2013-02-27 2015-10-14 日立数据系统有限公司 针对对象存储器索引系统的内容类别
CN103514555A (zh) * 2013-03-29 2014-01-15 洛阳中创网络技术服务有限公司 一种企业网站托管方法
CN105631050A (zh) * 2016-03-01 2016-06-01 国家计算机网络与信息安全管理中心 一种基于规则配置的url搜索关键词提取的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AWS: "《Amazon Simple Storage Service开发人员指南》", 1 March 2006 *

Similar Documents

Publication Publication Date Title
US11163957B2 (en) Performing semantic graph search
Das et al. Big data analytics: A framework for unstructured data analysis
JP6188732B2 (ja) マルチテナント環境におけるテナント固有のデータ・セットを管理するための、コンピュータで実施される方法、コンピュータ・プログラム製品、およびシステム
CN106202452A (zh) 大数据平台的统一数据资源管理系统与方法
CN105959416A (zh) 一种基于容器化技术的私有云存储系统
CN106844374A (zh) 一种存储、检索照片的方法及装置
CN106027295A (zh) 静态网站的托管方法和托管系统
Atazadeh et al. Comparing three types of BIM-Based Models for managing 3D ownership interests in multi-level buildings
KR101790766B1 (ko) 데이터의 검색 방법, 장치 및 단말기
US9916361B2 (en) Dynamically mapping zones
US20170091314A1 (en) Generating answers from concept-based representation of a topic oriented pipeline
Ko Cloud computing in plain english
CN110110184A (zh) 信息查询方法、系统、计算机系统及存储介质
CN106095341A (zh) 对象管理方法和对象管理系统
CN106021607A (zh) 静态托管网站的管理方法和管理系统
CN103685453B (zh) 一种云存储系统中元数据的获取方法
Kariyattin et al. Evaluating NextCloud as a file storage for apache airavata
Makris et al. Federating natural history museums in natural Europe
Abdalla et al. NoSQL: collection document and cloud by using a dynamic web query form
Subhashini et al. Data retrieval mechanism using Amazon simple storage service and Windows Azure
CN105930506A (zh) 对象检索方法和对象存储系统
CN106227830A (zh) 存储和读取文件的方法和装置
Bernier Decay spectroscopy of neutron-rich cadmium around the N= 82 shell closure
US11151109B2 (en) Indexing and archiving multiple statements using a single statement dictionary
US11100598B2 (en) Providing near real-time and effective litigation management for multiple remote content systems using asynchronous bi-directional replication pipelines

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161012