CN106815324A - 一种基于云计算对象存储快速检索系统 - Google Patents

一种基于云计算对象存储快速检索系统 Download PDF

Info

Publication number
CN106815324A
CN106815324A CN201611227383.1A CN201611227383A CN106815324A CN 106815324 A CN106815324 A CN 106815324A CN 201611227383 A CN201611227383 A CN 201611227383A CN 106815324 A CN106815324 A CN 106815324A
Authority
CN
China
Prior art keywords
resource
module
service
retrieval
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611227383.1A
Other languages
English (en)
Other versions
CN106815324B (zh
Inventor
王华龙
花榕励
秦涛
徐子杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GANSU WANWEI INFORMATION TECHNOLOGY CO LTD
Original Assignee
GANSU WANWEI INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GANSU WANWEI INFORMATION TECHNOLOGY CO LTD filed Critical GANSU WANWEI INFORMATION TECHNOLOGY CO LTD
Priority to CN201611227383.1A priority Critical patent/CN106815324B/zh
Publication of CN106815324A publication Critical patent/CN106815324A/zh
Application granted granted Critical
Publication of CN106815324B publication Critical patent/CN106815324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Abstract

一种基于云计算对象存储快速检索系统,由业务规则配置系统和检索系统构成,业务规则配置系统是检索系统的辅助系统,两者之间通过消息队列方式传递信号;而业务规则配置系统由系统管理模块、配置管理模块、参数管理模块和鉴权服务模块组成;检索系统是为外部业务系统提供资源数据存储和资源信息检索的能力,对外提供基于HTTPS安全协议的统一标准接口服务,对内采用消息队列方式进行模块间的数据通信和数据共享。本发明通过在云计算对象存储应用层面增加检索系统解决了用户复杂检索的需求,提升了资源数据检索的准确率和查询效率。

Description

一种基于云计算对象存储快速检索系统
技术领域
本发明涉及海量数据存储和数据检索技术领域,具体而言涉及一种基于云计算对象存储快速检索系统。
背景技术
云存储已经成为业界最为火热的概念之一,未来是云时代,没有存储设备,一切都将存储在云中,只要有网络存在均可从本地上传数据到云端,也可以从云端下载数据到本地。然而对于企业而言,数据的重要性往往建立在数据的使用和价值的分析上,对于生产环境产生的海量数据如何才能快速存取和应用与分析,其性能却是一大制约因素。如何能够快速定位存取企业所需要的数据是个很大的难题。目前对于对象存储主要应用于对公服务较多,比如:云盘、云文件夹等应用。而企业数据则更多的使用的是块存储和文件存储。块存储更像是一个底层设备,如:磁盘阵列和硬盘,把这些磁盘上的空间映射给主机使用,但主机之间却无法共享数据。文件NAS存储,类似一个包含根目录的层级文件系统,解决了共享,但却有一个最大的限制,就是对存储的文件数量有一定的限制。无论采用块存储还是文件存储对于海量数据存储均存在一定的弱项。块存储成本昂贵,一般企业都无法负担,而文件存储读写速度较慢,对于企业数据应用不利于提升工作效率。因此,对象存储给企业和个人提供了海量、安全、低成本、高可用的云存储服务。
云计算对象存储机制很好的解决了快速存取资源文件的系统,提供了高效率的接口服务。但是对于用户对资源的组合查询和复杂检索却显得无能为力,有了对象存储可以很好的解决了企业和个人数据存取的问题,但数据挖掘和数据检索问题一直存在,因此需要建立一整套,安全、可靠、高效存取、快速检索的对象存储体系框架,以便对用户提供高效率、低延迟的资源数据检索服务。
发明内容
本发明提供一种基于云计算对象存储快速检索系统,很好地解决了在高效率云计算对象存储数据后,可以通过用户自定义查询条件快速在海量数据中进行检索和资源定位。
本发明所采用的技术方案是:
一种基于云计算对象存储快速检索系统,该快速检索系统由业务规则配置系统和检索系统两部分构成,业务规则配置系统是检索系统的辅助系统,两者之间通过消息队列方式传递信号;而业务规则配置系统由系统管理模块、配置管理模块、参数管理模块和鉴权服务模块四部分组成;所述系统管理模块用于对外部业务系统的基本鉴权信息进行配置管理;所述配置管理模块提供了所能访问的资源权限和鉴权信息的配置管理;参数管理模块用于对系统参数的管理工作,为鉴权系统的公共信息进行参数化配置管理;鉴权服务模块用于对外部发起的请求进行安全验证和身份令牌发放工作,确保系统资源访问的安全性;所述系统配置管理模块为鉴权服务模块提供鉴权依据,而配置管理模块、参数管理模块和鉴权服务模块分别对所述快速检索系统独立提供服务;所述检索系统是为外部业务系统提供资源数据存储和资源信息检索的能力,对外提供基于HTTPS安全协议的统一标准接口服务,对内采用消息队列方式进行模块间的数据通信和数据共享;而检索系统主要由资源检索服务模块、算法配置模块、资源注册服务模块、资源上传服务模块、目录查询服务模块、服务调度模块和统一接口路由服务模块构成;资源检索服务模块主要提供资源检索和排序功能;算法配置模块主要用于对KD树检索相关算法参数的配置和管理,为资源检索提供算法依据;资源注册服务模块主要用于资源上传时对资源基本信息进行资源KD树索引建立;资源上传服务模块提供了资源上传接口服务;目录查询服务模块主要提供了对资源目录的查询服务,方便资源的管理和排列;服务调度模块负责协调各个服务模块间的工作协同和服务负载动态平衡;统一接口路由服务模块为所述快速检索系统提供统一入口和路由选择服务,可进行访问控制和非法请求的过滤。
所述算法配置模块中的算法包括:近邻法、二分法或相似性检索法。
所述资源检索服务模块提供资源模糊搜索通过关键词和关键字并根据算法配置模块配置的检索算法进行快速检索的功能。
本发明的有益效果是:
本发明主要建立在云计算对象存储之上,是一种通过对上传资源信息构造KD树进行快速检索的系统。KD树是一种对k维空间中的实例点进行存储以便对其进行快速检索的树形数据结构。将资源检索信息树存储于共享内存中,通过搜索KD树的方法进行数据快速检索。本发明通过在云计算对象存储应用层面增加检索系统很好的解决了用户复杂检索的需求,提升了资源数据检索的准确率和查询效率。
附图说明
图1是本发明分析框架示意图;
图2是本发明业务调度示意图;
图3是本发明数据流转示意图。
具体实施方式
下面结合附图对本发明及其效果作进一步说明。
本发明是采用云计算对象存储技术进行底层数据存储,在云计算对象存储之上通过构建上层应用有效解决用户复杂检索的业务需求。对象存储系统(Object-BasedStorage System)是综合了NAS(网络附属存储)和SAN(存储区域网络)的优点,同时具有SAN的高速直接访问和NAS的数据共享等优势,提供了高可靠性、跨平台性以及安全的数据共享的存储体系结构。
如图1所示,从系统架构的整体方面来说,云计算对象存储快速检索系统由两部分构成:业务规则配置系统和检索系统。其中业务规则配置系统是检索系统的辅助系统,主要提供了系统管理模块、配置管理模块、参数管理模块和鉴权服务模块四部分。系统管理模块主要提供了,对外部系统的管理,对外部业务系统的基本鉴权信息进行配置管理,为鉴权服务提供鉴权依据。配置管理模块提供了所能访问的资源权限和鉴权信息的配置管理。资源权限是指资源虚拟路径和资源上传、下载和查询的权限。参数管理模块主要提供了对系统参数的管理工作,为鉴权系统的公共信息进行参数化配置管理。鉴权服务模块为系统提供了安全保障,对外部发起的请求进行安全验证和身份令牌发放工作,确保系统资源访问的安全性。检索系统是为外部业务系统提供资源数据存储和资源信息检索的能力。对外提供基于HTTPS安全协议的统一标准接口服务,对内采用消息队列方式进行模块间的数据通信和数据共享。主要构成模块有:资源检索服务模块、算法配置模块模块、资源注册服务模块、资源上传服务模块、目录查询服务模块、服务调度模块和统一接口路由服务模块。资源检索服务模块主要提供资源检索和排序功能。提供资源模糊搜索通过关键词和关键字根据算法配置模块配置的检索算法进行快速检索的功能。算法配置模块主要对KD树检索相关算法参数的配置和管理,算法包括:近邻法、二分法、相似性检索法等,为资源检索提供算法依据。资源注册服务模块主要用于资源上传时对资源基本信息进行资源KD树索引建立。资源上传服务模块提供了资源上传接口服务,当收到合法的资源上传请求时,通过异步现成调用资源注册服务进行资源信息注册,同时对请求上传的资源在对象存储中进行存储的功能。目录查询服务模块主要提供了对资源目录的查询服务,对资源检索起到辅助作用,主要目的为方便资源的管理和排列。服务调度模块负责协调各个服务模块间的工作协同和服务负载动态平衡。统一接口路由服务模块提供了统一入口和路由选择服务,可进行访问控制和非法请求的过滤。访问控制是通过路由规则进行判断将路由至哪个服务器的哪个服务。主要通过客户端的IP地址和请求参数进行确定。客户端IP地址可用于选择客户端请求服务效率最高速度最快的服务地址,通过请求参数确定服务的最终地址。
上述消息队列技术是分布式应用间交换信息的一种技术。消息队列可驻留在内存或磁盘上,队列存储消息直到它们被应用程序读走。通过消息队列,应用程序可独立地执行--它们不需要知道彼此的位置、或在继续执行前不需要等待接收程序接收此消息。
图2是本发明的内部模块服务调用示意图。本发明提供的统一标准接口服务,提供了资源存储或资源检索功能。检索系统通过统一接口路由服务模块进行路由识别和转发,由鉴权服务模块进行安全性识别,并配发统一身份识别代码。认证鉴权成功后,通知统一接口路由服务模块,并返回统一身份识别代码。统一接口路由服务模块将统一身份识别代码组装后转发路由请求至资源上传服务模块或资源检索服务模块。资源上传服务模块或资源检索服务模块通过内部消息队列确认身份认证后,对外提供服务。
通过上述的业务调度流程确保了服务模块间调用的安全性。通过共享内存技术和消息队列技术确保了数据的高效传输和共享。
图3是本发明数据流转示意图,主要描述了整个系统体系业务数据的流转方向。确保了业务数据从请求到响应形成了完整的闭环,使得各个环节能够分工明确,业务流转清晰可见。资源上传流程:1、用户登录/成册成功后,选择资源文件的上传;2、第三方业务系统接受到上传请求后,通过业务规则构造鉴权信息和封装业务数据,转发至云计算对象存储快速检索系统的统一接口路由服务模块;3、统一接口路由服务模块根据配置规则将信息转发至鉴权服务模块,鉴权成功后,路由至资源上传服务模块;4、资源上传服务模块处理资源上传请求,并返回上传结果和进度结果;5、第三方业务系统收到响应后,展现结果。资源检索流程:1、用户登录/注册成功后,在第三方业务系统的资源检索界面输入检索条件,并进行检索;2、第三方业务系统收到检索请求后,通过构造鉴权信息和封装业务数据,转发至检索系统的统一接口路由服务模块;3、统一接口路由服务模块根据配置规则将信息转发至鉴权服务模块,鉴权成功后,路由至资源检索服务模块;4、资源检索服务模块根据检索算法在KD树进行资源检索,成功后返回检索结果;5、第三方业务系统受到响应后,展现资源检索结果。
本发明主要是建立在云计算对象存储之上,通过对上传资源信息构造KD树进行快速检索的系统。KD树是一种对k维空间中的实例点进行存储以便对其进行快速检索的树形数据结构。将资源检索信息树存储于共享内存中,通过搜索KD树的方法进行数据快速检索,为用户提供直观有效的资源索引,方便用户快速检索和查询资源数据。k近邻法中的分类决策规则往往是多数表决,即由输入实例的k个邻近的训练实例中的多数类决定输入实例的类。如果分类的损失函数为0-1损失分类,分类函数为:,那么误分类的概率是对给定的实例,其最近邻的k个训练实例点构成集合。如果涵盖的区域的类别是,那么误分类率是要使误分类率最小即经验风险最小,就要使最大,因此需要经验风险最小化。通过应用分类决策规则公式对资源数据进行按资源日期和资源类型特征向量进行分类后,建立KD树,通过给定一个目标点,搜索近邻节点资源,从而达到资源快速检索的目的。
本发明针对综合办公附件系统的具体实例为:步骤一,在业务规则配置系统的系统管理模块中建立综合办公附件系统鉴权信息;步骤二,在业务规则配置系统配置管理模块完成对综合办公附件系统的相关配置,主要有:特征码配置、权限配置等;步骤三,在综合办公附件系统中配置并完成检索系统的地址和集成接口服务的客户端,并在相应的业务代码中进行调用;步骤四,通过综合办公系统的用户登录后,对资源文件进行上传、检索、下载等动作;步骤五,从检索系统管理界面可以查看到当前用户的操作和进度及耗时,从日志模块中可以查看到该用户的查询请求的路径及请求资源相关信息。步骤六,从综合办公附件系统进行附件资源分析检索与给定的附件相关的附件列表。步骤七,检索系统通过鉴权后,根据检索需求获取检索算法,根据检索算法在KD树中进行数据检索查询相关附件信息,并返回结果至综合办公附件系统。

Claims (3)

1.一种基于云计算对象存储快速检索系统,其特征在于:该快速检索系统由业务规则配置系统和检索系统两部分构成,业务规则配置系统是检索系统的辅助系统,两者之间通过消息队列方式传递信号;而业务规则配置系统由系统管理模块、配置管理模块、参数管理模块和鉴权服务模块四部分组成;所述系统管理模块用于对外部业务系统的基本鉴权信息进行配置管理;所述配置管理模块提供了所能访问的资源权限和鉴权信息的配置管理;参数管理模块用于对系统参数的管理工作,为鉴权系统的公共信息进行参数化配置管理;鉴权服务模块用于对外部发起的请求进行安全验证和身份令牌发放工作,确保系统资源访问的安全性;所述系统配置管理模块为鉴权服务模块提供鉴权依据,而配置管理模块、参数管理模块和鉴权服务模块分别对所述快速检索系统独立提供服务;所述检索系统是为外部业务系统提供资源数据存储和资源信息检索的能力,对外提供基于HTTPS安全协议的统一标准接口服务,对内采用消息队列方式进行模块间的数据通信和数据共享;而检索系统主要由资源检索服务模块、算法配置模块、资源注册服务模块、资源上传服务模块、目录查询服务模块、服务调度模块和统一接口路由服务模块构成;资源检索服务模块主要提供资源检索和排序功能;算法配置模块主要用于对KD树检索相关算法参数的配置和管理,为资源检索提供算法依据;资源注册服务模块主要用于资源上传时对资源基本信息进行资源KD树索引建立;资源上传服务模块提供了资源上传接口服务;目录查询服务模块主要提供了对资源目录的查询服务,方便资源的管理和排列;服务调度模块负责协调各个服务模块间的工作协同和服务负载动态平衡;统一接口路由服务模块为所述快速检索系统提供统一入口和路由选择服务,可进行访问控制和非法请求的过滤。
2.根据权利要求1所述的一种基于云计算对象存储快速检索系统,其特征在于:所述算法配置模块中的算法包括:近邻法、二分法或相似性检索法。
3.根据权利要求1所述的一种基于云计算对象存储快速检索系统,其特征在于:所述资源检索服务模块提供资源模糊搜索通过关键词和关键字并根据算法配置模块配置的检索算法进行快速检索的功能。
CN201611227383.1A 2016-12-27 2016-12-27 一种基于云计算对象存储快速检索系统 Active CN106815324B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611227383.1A CN106815324B (zh) 2016-12-27 2016-12-27 一种基于云计算对象存储快速检索系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611227383.1A CN106815324B (zh) 2016-12-27 2016-12-27 一种基于云计算对象存储快速检索系统

Publications (2)

Publication Number Publication Date
CN106815324A true CN106815324A (zh) 2017-06-09
CN106815324B CN106815324B (zh) 2020-08-04

Family

ID=59110163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611227383.1A Active CN106815324B (zh) 2016-12-27 2016-12-27 一种基于云计算对象存储快速检索系统

Country Status (1)

Country Link
CN (1) CN106815324B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115114361A (zh) * 2022-06-25 2022-09-27 上海道客网络科技有限公司 一种基于容器云平台统一接口的资源检索方法和系统
CN112435022B (zh) * 2020-11-19 2023-09-22 上海领健信息技术有限公司 基于用户实时数据的动态检索系统、及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070198498A1 (en) * 2006-02-09 2007-08-23 Ebay Inc. Method and system to analyze rules based on aspect coverage
US20100082704A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Real-time kd-tree construction on graphics hardware
CN102685148A (zh) * 2012-05-31 2012-09-19 清华大学 一种云存储环境下的安全网盘系统的实现方法
CN103003823A (zh) * 2010-06-30 2013-03-27 惠普发展公司,有限责任合伙企业 用于授权的自助配置的系统和方法
CN103118089A (zh) * 2013-01-22 2013-05-22 华中科技大学 一种基于多个云存储系统的安全存储方法及其系统
CN103646111A (zh) * 2013-12-25 2014-03-19 普元信息技术股份有限公司 大数据环境下实现实时数据关联的系统及方法
CN104331477A (zh) * 2014-11-04 2015-02-04 哈尔滨工业大学 基于联邦式检索的云平台并发性能测试方法
CN104462579A (zh) * 2014-12-30 2015-03-25 浪潮电子信息产业股份有限公司 一种大数据管理平台的作业任务管理方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070198498A1 (en) * 2006-02-09 2007-08-23 Ebay Inc. Method and system to analyze rules based on aspect coverage
US20100082704A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Real-time kd-tree construction on graphics hardware
CN103003823A (zh) * 2010-06-30 2013-03-27 惠普发展公司,有限责任合伙企业 用于授权的自助配置的系统和方法
CN102685148A (zh) * 2012-05-31 2012-09-19 清华大学 一种云存储环境下的安全网盘系统的实现方法
CN103118089A (zh) * 2013-01-22 2013-05-22 华中科技大学 一种基于多个云存储系统的安全存储方法及其系统
CN103646111A (zh) * 2013-12-25 2014-03-19 普元信息技术股份有限公司 大数据环境下实现实时数据关联的系统及方法
CN104331477A (zh) * 2014-11-04 2015-02-04 哈尔滨工业大学 基于联邦式检索的云平台并发性能测试方法
CN104462579A (zh) * 2014-12-30 2015-03-25 浪潮电子信息产业股份有限公司 一种大数据管理平台的作业任务管理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
蒋新华: "《交通运输行业物联网与云计算技术》", 31 January 2014, 中国铁道出版社 *
郭薇: "《空间数据库索引技术》", 30 April 2006, 上海交通大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112435022B (zh) * 2020-11-19 2023-09-22 上海领健信息技术有限公司 基于用户实时数据的动态检索系统、及方法
CN115114361A (zh) * 2022-06-25 2022-09-27 上海道客网络科技有限公司 一种基于容器云平台统一接口的资源检索方法和系统

Also Published As

Publication number Publication date
CN106815324B (zh) 2020-08-04

Similar Documents

Publication Publication Date Title
US11836583B2 (en) Method, apparatus and system for secure vertical federated learning
Atlam et al. Technical aspects of blockchain and IoT
Buyya et al. Internet of Things: Principles and paradigms
US11294981B2 (en) System and method for large scale crowdsourcing of map data cleanup and correction
CN103718164B (zh) 虚拟计算机和服务
US20190080063A1 (en) De-identification architecture
CN107403173A (zh) 一种人脸识别系统及方法
CN110024330A (zh) 对IoT装置的服务提供
CN107079060A (zh) 用于运营商级nat优化的系统和方法
US10083186B2 (en) System and method for large scale crowdsourcing of map data cleanup and correction
KR20190087962A (ko) 스택 데이터 구조 백그라운드의 디지털 어시스턴트 프로세싱
Lopez et al. A blockchain framework for smart mobility
CN107256275A (zh) 路由查询结果
CN109918375A (zh) 一种基于区块链和分布式存储的大文本存储、索引及检索方法
WO2023048770A1 (en) Apparatus, articles of manufacture, and methods for data collection balancing for sustainable storage
CN110149307A (zh) 一种idc安全管理系统
CN105612539A (zh) 在租赁代理系统当中的生产者系统划分
CN110169019A (zh) 数据库功能定义的网络交换机和数据库系统
Nguyen et al. A novel internet-of-drones and blockchain-based system architecture for search and rescue
CN106815324A (zh) 一种基于云计算对象存储快速检索系统
Sundarakumar et al. A heuristic approach to improve the data processing in big data using enhanced Salp Swarm algorithm (ESSA) and MK-means algorithm
CN112905571B (zh) 一种列车轨道交通传感器数据管理方法及装置
CN114328576A (zh) 一种基于星际文件系统的分布式协同查询处理系统
US11750469B2 (en) Edge-based artificial intelligence enablement
Abdelbaky et al. DRF: A software architecture for a data marketplace to support advanced air mobility

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 730000 Zhang Suzhou beach, Chengguan District, Lanzhou City, Gansu Province, No. 553 (4-7 layer of B area of Telecom second hub)

Applicant after: China Power World Wide Information Technology Co.,Ltd.

Address before: 730000 No. 553 Zhang Su beach, Gansu, Lanzhou

Applicant before: GANSU WANWEI Co.

GR01 Patent grant
GR01 Patent grant