CN103955500B - 基于云存储的海量文档数据信息结构化展示方法及系统 - Google Patents
基于云存储的海量文档数据信息结构化展示方法及系统 Download PDFInfo
- Publication number
- CN103955500B CN103955500B CN201410164313.0A CN201410164313A CN103955500B CN 103955500 B CN103955500 B CN 103955500B CN 201410164313 A CN201410164313 A CN 201410164313A CN 103955500 B CN103955500 B CN 103955500B
- Authority
- CN
- China
- Prior art keywords
- cloud storage
- document
- document data
- data
- structural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/156—Query results presentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Abstract
本发明提供一种基于云存储的海量文档数据信息结构化展示方法及系统,该方法包括以下步骤:获取云存储平台内的所有文档数据信息;对所获取到的文档数据信息根据上下级结构关系进行递归处理成统一格式,并将递归处理后的结构化数据以及原始文档数据信息输出到文档缓存中进行保存;实时监控云存储平台,根据监控的结果判断云存储平台内的数据是否发生变化;若是则将变化后的文档数据信息与文档缓存内的原始文档数据信息进行比对,对变化的数据进行增量处理;更新所述文档缓存内的原始文档数据信息以及结构化数据,读取所述文档缓存内的结构化数据并通过云存储管理平台进行展示。本发明降低了对海量数据的处理时间和提高了云存储管理平台的执行效率。
Description
技术领域
本发明涉及云存储技术的应用领域,特别是涉及一种基于云存储的海量文档数据信息结构化展示方法以及一种基于云存储的海量文档数据信息结构化展示系统。
背景技术
云存储是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。在现实应用中,云存储平台一般由云存储基础设施和云存储管理平台组成。其中由云存储基础设施来提供相应的物理设施(包括虚拟化);云存储管理平台对外提供操作界面供用户对其内部存储的文档数据信息进行操作,对内根据用户操作向云存储基础设施内发出相应存储命令。
云存储平台旨在提供数据存储服务,存储最多的则是等级从属关系明确的结构化文档数据信息,因而就要求云存储管理平台能够实时的真实展现与云存储平台内部一致的文档数据信息,否则将会产生严重后果。传统方法中,云存储管理平台在数据提取过程中只能读取每一文档自身整体的上下级结构关系,而整个存储平台内的总体文档数据结构的确认则需要对获取的所有单个文档经过多次处理后才能得到,如果是海量文档的话,则处理时间更长;同时每当有文档更新时不但需要对海量数据重新处理,还要不停的与存储平台交互,大大降低了云存储管理平台的执行效率。
发明内容
基于此,本发明提供一种基于云存储的海量文档数据信息结构化展示方法及系统,能够降低对海量数据的处理时间和提高云存储管理平台的执行效率。
为实现上述目的,本发明采用如下的技术方案:
一种基于云存储的海量文档数据信息结构化展示方法,包括以下步骤:
获取云存储平台内的所有文档数据信息;
对所获取到的文档数据信息根据上下级结构关系进行递归处理成统一格式,并将递归处理后的结构化数据以及原始文档数据信息输出到文档缓存中进行保存;
实时监控云存储平台,并根据监控的结果判断云存储平台内的数据是否发生变化;
若是,则将变化后的文档数据信息与文档缓存内的原始文档数据信息进行比对,根据比对的结果对变化的数据进行增量处理;
更新所述文档缓存内的原始文档数据信息以及结构化数据,读取所述文档缓存内的结构化数据并通过云存储管理平台进行展示。
一种基于云存储的海量文档数据信息结构化展示系统,包括:
信息获取模块,用于获取云存储平台内的所有文档数据信息;
全量处理模块,用于对所获取到的文档数据信息根据上下级结构关系进行递归处理成统一格式,并将递归处理后的结构化数据以及原始文档数据信息输出到文档缓存中进行保存;
判断模块,用于实时监控云存储平台,并根据监控的结果判断云存储平台内的数据是否发生变化;
增量处理模块,用于在所述判断模块的判断结果为是的情况下,将变化后的文档数据信息与文档缓存内的原始文档数据信息进行比对,根据比对的结果对变化的数据进行增量处理;
第一展示模块,用于更新所述文档缓存内的原始文档数据信息以及结构化数据,读取所述文档缓存内的结构化数据并通过云存储管理平台进行展示。
由以上方案可以看出,本发明的一种基于云存储的海量文档数据信息结构化展示方法及系统,能够独立地把云存储平台内当前状态下的文档数据信息高效处理为统一格式后存储到特定的文件缓存域中,使得任何特定的前台界面展示方法都可以对该结构化数据进行展示。本发明采用异步方式与后台交互,能够快速地把海量数据呈现给用户而不给云存储管理平台造成过大的通信负荷,降低了对海量数据的处理时间,减少了平台间的交互,提高了云存储管理平台的执行效率;并且本发明可以为任何界面展示方法提供级别及所属关系明确的统一数据,避免因展示方法的不同而造成的数据重复处理,能够实时、快速、准确、结构化的向用户真实展现云存储平台内部的文档数据信息。
附图说明
图1为本发明的一种基于云存储的海量文档数据信息结构化展示方法流程示意图;
图2为本发明的系统实现框图;
图3为本发明的一种基于云存储的海量文档数据信息结构化展示系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
除非上下文另有特定清楚的描述,本发明中的元件和组件,数量既可以单个的形式存在,也可以多个的形式存在,本发明并不对此进行限定。本发明中的步骤虽然用标号进行了排列,但并不用于限定步骤的先后次序,除非明确说明了步骤的次序或者某步骤的执行需要其他步骤作为基础,否则步骤的相对次序是可以调整的。
参见图1所示,一种基于云存储的海量文档数据信息结构化展示方法,包括以下步骤:
步骤S101,一次性地获取云存储平台内的所有文档数据信息,然后进入步骤S102。
步骤S102,对所获取到的文档数据信息根据上下级结构关系进行递归处理成统一格式,并将递归处理后的结构化数据以及原始文档数据信息一并输出到文档缓存中进行保存,然后进入步骤S103。
步骤S103,实时监控云存储平台,并根据监控的结果判断云存储平台内的数据是否发生变化;若是,则进入步骤S104,否则(即云存储平台内的数据未发生变化),可以直接读取所述文档缓存内的结构化数据并通过云存储管理平台真实展示系统文档结构信息。
步骤S104,若步骤S103的判断结果为是(即云存储平台内的数据发生变化),则触发增量处理功能,将变化后的文档数据信息与文档缓存内的原始文档数据信息进行比对,根据比对的结果对变化的数据进行增量处理,将变化的数据也根据上下级结构关系进行递归处理成所述的统一格式,然后进入步骤S105。
步骤S105,更新所述文档缓存内的原始文档数据信息以及结构化数据,读取所述文档缓存内的结构化数据并通过云存储管理平台进行展示。
作为一个较好的实施例,本发明中更新所述文档缓存内的原始文档数据信息的过程具体可以包括如下步骤:根据变化后的文档数据信息来更新所述原始文档数据信息。即本发明中的原始文档数据信息并不是一成不变的,当云存储平台中的数据发生变化或更新后,本发明中将变化后的文档数据信息作为新的“原始文档数据信息”,以保证下次进行比对时能快速的找出本次变化的数据并进行增量处理。
同理,作为一个较好的实施例,本发明中更新所述文档缓存内的结构化数据的过程具体可以包括如下步骤:根据增量处理的结果来更新所述结构化数据。
如图2所示,本发明中的文档缓存会实时监控云存储平台内存储的文档数据信息的变化,并实时触发增量处理功能,及时更新缓存内的数据结构信息,以确保文档缓存中的缓存数据与实际数据的一致性。
与上述一种基于云存储的海量文档数据信息结构化展示方法相对应,本发明还提供一种基于云存储的海量文档数据信息结构化展示系统,如图3所示,包括:
信息获取模块101,用于获取云存储平台内的所有文档数据信息;
全量处理模块102,用于对所获取到的文档数据信息根据上下级结构关系进行递归处理成统一格式,并将递归处理后的结构化数据以及原始文档数据信息输出到文档缓存中进行保存;
判断模块103,用于实时监控云存储平台,并根据监控的结果判断云存储平台内的数据是否发生变化;
增量处理模块104,用于在所述判断模块的判断结果为是的情况下,将变化后的文档数据信息与文档缓存内的原始文档数据信息进行比对,根据比对的结果对变化的数据进行增量处理;
第一展示模块105,用于更新所述文档缓存内的原始文档数据信息以及结构化数据,读取所述文档缓存内的结构化数据并通过云存储管理平台进行展示。
作为一个较好的实施例,所述展示模块可以包括:
第一更新模块,用于根据变化后的文档数据信息来更新所述原始文档数据信息。
作为一个较好的实施例,所述展示模块可以包括:
第二更新模块,用于根据增量处理的结果来更新所述结构化数据。
作为一个较好的实施例,本发明的一种基于云存储的海量文档数据信息结构化展示系统还可以包括:
第二展示模块,用于在所述判断模块的判断结果为否的情况下,直接读取所述文档缓存内的结构化数据并通过云存储管理平台进行展示。
可以理解,本发明所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本发明的范围的情况下,可以将第一展示模块称为第二展示模块,且类似地,可将第二展示模块称为第一展示模块。第一展示模块和第二展示模块两者都是展示模块,但其不是同一展示模块。
上述一种基于云存储的海量文档数据信息结构化展示系统的其它技术特征与本发明的一种基于云存储的海量文档数据信息结构化展示方法相同,此处不予赘述。
通过以上方案可以看出,本发明的一种基于云存储的海量文档数据信息结构化展示方法及系统,能够独立地把云存储平台内当前状态下的文档数据信息高效处理为统一格式后存储到特定的文件缓存域中,使得任何特定的前台界面展示方法都可以对该结构化数据进行展示。本发明采用异步方式与后台交互,能够快速地把海量数据呈现给用户而不给云存储管理平台造成过大的通信负荷,降低了对海量数据的处理时间,减少了平台间的交互,提高了云存储管理平台的执行效率;并且本发明可以为任何界面展示方法提供级别及所属关系明确的统一数据,避免因展示方法的不同而造成的数据重复处理,能够实时、快速、准确、结构化的向用户真实展现云存储平台内部的文档数据信息。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (4)
1.一种基于云存储的海量文档数据信息结构化展示方法,其特征在于,包括以下步骤:
获取云存储平台内的所有文档数据信息;
对所获取到的文档数据信息根据上下级结构关系进行递归处理成统一格式,并将递归处理后的结构化数据以及原始文档数据信息输出到文档缓存中进行保存;
实时监控云存储平台,并根据监控的结果判断云存储平台内的数据是否发生变化;
若是,则将变化后的文档数据信息与文档缓存内的原始文档数据信息进行比对,根据比对的结果对变化的数据进行增量处理;
更新所述文档缓存内的原始文档数据信息以及结构化数据,读取所述文档缓存内的结构化数据并通过云存储管理平台进行展示;
所述更新所述文档缓存内的原始文档数据信息的过程包括:
根据变化后的文档数据信息来更新所述原始文档数据信息;
所述更新所述文档缓存内的结构化数据的过程包括:
根据增量处理的结果来更新所述结构化数据。
2.根据权利要求1所述的基于云存储的海量文档数据信息结构化展示方法,其特征在于,若判断得出云存储平台内的数据未发生变化,则直接读取所述文档缓存内的结构化数据并通过云存储管理平台进行展示。
3.一种基于云存储的海量文档数据信息结构化展示系统,其特征在于,包括:
信息获取模块,用于获取云存储平台内的所有文档数据信息;
全量处理模块,用于对所获取到的文档数据信息根据上下级结构关系进行递归处理成统一格式,并将递归处理后的结构化数据以及原始文档数据信息输出到文档缓存中进行保存;
判断模块,用于实时监控云存储平台,并根据监控的结果判断云存储平台内的数据是否发生变化;
增量处理模块,用于在所述判断模块的判断结果为是的情况下,将变化后的文档数据信息与文档缓存内的原始文档数据信息进行比对,根据比对的结果对变化的数据进行增量处理;
第一展示模块,用于更新所述文档缓存内的原始文档数据信息以及结构化数据,读取所述文档缓存内的结构化数据并通过云存储管理平台进行展示;
所述展示模块包括:
第一更新模块,用于根据变化后的文档数据信息来更新所述原始文档数据信息;
第二更新模块,用于根据增量处理的结果来更新所述结构化数据。
4.根据权利要求3所述的基于云存储的海量文档数据信息结构化展示系统,其特征在于,还包括:
第二展示模块,用于在所述判断模块的判断结果为否的情况下,直接读取所述文档缓存内的结构化数据并通过云存储管理平台进行展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410164313.0A CN103955500B (zh) | 2014-04-22 | 2014-04-22 | 基于云存储的海量文档数据信息结构化展示方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410164313.0A CN103955500B (zh) | 2014-04-22 | 2014-04-22 | 基于云存储的海量文档数据信息结构化展示方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103955500A CN103955500A (zh) | 2014-07-30 |
CN103955500B true CN103955500B (zh) | 2017-05-24 |
Family
ID=51332775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410164313.0A Active CN103955500B (zh) | 2014-04-22 | 2014-04-22 | 基于云存储的海量文档数据信息结构化展示方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103955500B (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080104024A1 (en) * | 2006-10-25 | 2008-05-01 | Amit Kumar | Highlighting results in the results page based on levels of trust |
CN101853288A (zh) * | 2010-05-19 | 2010-10-06 | 马晓普 | 基于文档实时监控可配置的全文检索服务系统 |
CN102034049B (zh) * | 2010-12-30 | 2013-05-01 | 华中科技大学 | 海量数据压缩加密存储及检索系统及其使用方法 |
CN103399857B (zh) * | 2013-07-01 | 2017-02-08 | 北京航空航天大学 | 一种通用文档结构信息抽取方法 |
CN103530343B (zh) * | 2013-10-08 | 2017-03-22 | 北京百度网讯科技有限公司 | 结构化数据交互系统、数据接收端和结构化数据交互方法 |
-
2014
- 2014-04-22 CN CN201410164313.0A patent/CN103955500B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN103955500A (zh) | 2014-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102930062B (zh) | 一种数据库快速水平扩展的方法 | |
CN104104971B (zh) | 一种视频文件处理方法及系统 | |
US9424330B2 (en) | Database sharding by shard levels | |
CN104104717A (zh) | 投放渠道数据统计方法及装置 | |
CN104601736A (zh) | 一种短url服务的实现方法及装置 | |
US20150205847A1 (en) | Database generation from a spreadsheet | |
CN110019080B (zh) | 数据访问方法和装置 | |
CN108182213A (zh) | 一种基于分布式系统的数据处理优化装置及方法 | |
CN107463610B (zh) | 一种数据入库方法及装置 | |
CN102855271A (zh) | 一种多版本电网模型的存储与可追溯管理方法 | |
CN107179878A (zh) | 基于应用优化的数据存储的方法和装置 | |
CN104111924A (zh) | 一种数据库系统 | |
JP2010514033A5 (zh) | ||
CN109408468A (zh) | 文件处理方法和装置、计算设备及存储介质 | |
CN109564569A (zh) | 减少用于长期计算的存储器使用 | |
CN106503008A (zh) | 文件存储方法和装置及文件查询方法和装置 | |
CN105933154A (zh) | 一种云计算资源的管理方法 | |
CN106254489A (zh) | 一种无文件传输的云渲染系统及其方法 | |
CN109034880A (zh) | 收入预测方法及装置 | |
CN107943423A (zh) | 云系统中存储资源的管理方法和计算机可读存储介质 | |
CN105978712A (zh) | 一种云计算管理系统的方法 | |
CN101635001A (zh) | 从数据库提取信息的方法和设备 | |
CN109670126A (zh) | 一种跨境访问加速方法及装置 | |
CN103955500B (zh) | 基于云存储的海量文档数据信息结构化展示方法及系统 | |
CN103077174A (zh) | 一种并发的资源更新方法与设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |