CN110941619B - 针对多种使用场景的图数据存储模型和结构的定义方法 - Google Patents

针对多种使用场景的图数据存储模型和结构的定义方法 Download PDF

Info

Publication number
CN110941619B
CN110941619B CN201911211045.2A CN201911211045A CN110941619B CN 110941619 B CN110941619 B CN 110941619B CN 201911211045 A CN201911211045 A CN 201911211045A CN 110941619 B CN110941619 B CN 110941619B
Authority
CN
China
Prior art keywords
data
node
graph
driver
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911211045.2A
Other languages
English (en)
Other versions
CN110941619A (zh
Inventor
赵振修
周庆勇
解一豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Software Co Ltd
Original Assignee
Inspur Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Software Co Ltd filed Critical Inspur Software Co Ltd
Priority to CN201911211045.2A priority Critical patent/CN110941619B/zh
Publication of CN110941619A publication Critical patent/CN110941619A/zh
Application granted granted Critical
Publication of CN110941619B publication Critical patent/CN110941619B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种针对多种使用场景的图数据存储模型和结构的定义方法,属于应用数据挖掘技术的图存储设计领域,本发明要解决的技术问题为如何实现数据的均衡分布以及关系数据的高效查询与分析,同时满足数据的实时增、删、改的使用场景,采用的技术方案为:该方法包括:采用主索引+点数据+边数据分离存储的存储结构;采用Driver节点与数据节点相结合的方式,Driver节点作为驱动节点,配合多个数据节点进行使用,提高查询的效率;采用数据预加载机制,对热点数据进行缓存,减少查询和计算的时间;图数据存储结构化,以结构化的方式存储非结构化的图数据,实现数据实时的增删改,满足数据的实时性。

Description

针对多种使用场景的图数据存储模型和结构的定义方法
技术领域
本发明属于应用数据挖掘技术的图存储设计领域,具体地说是一种针对多种使用场景的图数据存储模型和结构的定义方法。
背景技术
图(Graph)是表示实体与实体之间的关系的数学逻辑对象,在数学中被表示为一个G=(V,E)的二元组,其自身由N个顶点(V=vertex)和M个边(E=edge)构成,每个顶点对应着多个边(<=M),每个边有连接着两个顶点,边可以存在方向,如果图所包含的边带有方向,称为有向图(oriented graph),反之为无向图(undirected graph)。图论(GraphTheory)是以图为基本研究对象的一个数学分支,而使用图论对图进行求解的算法被称为图算法(Graph Algorithm)。
在现今互联网信息行业中,图和图算法在数据挖掘(Data Mining)领域得到了广泛的使用,其所延伸出的应用包括:交通路由、社交网络计算、商品推荐、网络通信等。
图数据库(graph database)是根据图作为逻辑结构进行存取的数据库工具,常见的图数据库包括:neo4j、janusgraph、titan等,但都存在各自的非适用场景。例如,neo4j非分布式存储,janusgraph数据存储集中,可能但节点数据过多,分布不均等。选一个图数据库,主要可以从性能、容量、查询能力等各方面考虑:
(1)、性能:要求图查询及图分析算法的执行快,涉及到底层存储结构,原生图存储基于点和边,计算中不需要过多的逻辑和物理层转换;
(2)、容量:大数据时代可获取的数据越来越多,单机的容量有限。原生图存储如何实现分布式存储是困难所在;
(3)、查询能力:图数据库要具备点关系的查询能力,必不可少的如两点间所有路径,最短路径,多度查询等。
结合当前实际中的应用场景,针对所用图数据库的数据分布不均等问题,故如何实现数据的均衡分布以及关系数据的高效查询与分析,同时满足数据的实时增、删、改的使用场景是目前现有技术中急需解决的问题。
专利号为CN109446362A的专利文献公开了基于外存的图数据库结构,图数据存储方法,图数据存储装置和电子设备。该图数据存储方法包括:分别将图数据中的每一顶点数据和与该顶点相关的入边数据和出边数据存储于一数据存储节点;分别指定不同的键值对应于不同的数据存储节点,其中,键值表示用以表征不同数据存储节点的唯一标识符,以及,将所有的数据存储节点保存于一数据树中。但是该技术方案不能实现数据的均衡分布以及关系数据的高效查询与分析,同时满足数据的实时增、删、改的使用场景。
专利号为CN110321444A的专利文献公开了一种基于图数据库的存储方法,所述基于图数据库的存储方法包括以下步骤:获取待存储实例和所述待存储实例之间的待存储关系;建立所述待存储实例对应的实例节点和所述待存储关系对应的关系实例节点;将所述关系实例节点与构成所述待存储关系的各个实例对应的实例节点分别通过有向线段连接。但是该技术方案不能实现数据的均衡分布以及关系数据的高效查询与分析,同时满足数据的实时增、删、改的使用场景。
发明内容
本发明的技术任务是提供一种针对多种使用场景的图数据存储模型和结构的定义方法,来解决如何实现数据的均衡分布以及关系数据的高效查询与分析,同时满足数据的实时增、删、改的使用场景的问题。
本发明的技术任务是按以下方式实现的,一种针对多种使用场景的图数据存储模型和结构的定义方法,该方法包括:
采用主索引+点数据+边数据分离存储的存储结构,围绕主索引数据为核心,点数据和边数据集成使用的思想,满足不同查询场景的使用;
采用Driver节点与数据节点相结合的方式,Driver节点作为驱动节点,配合多个数据节点进行使用,提高查询的效率;
采用数据预加载机制,对热点数据进行缓存,减少查询和计算的时间;
图数据存储结构化,以结构化的方式存储非结构化的图数据,实现数据实时的增删改,满足数据的实时性。
作为优选,所述主索引是指数据存储时,维护一份srcId+edgeId+tarId为索引的主索引数据,主索引数据根据srcId进行哈希分片,保证索引与数据信息在一个分片。
作为优选,所述点数据中点的详细信息存储的物理文件,根据点的ID进行哈希分片。
作为优选,所述边数据中边的详细信息存储的物理文件,边的存储暂时未做分片(考虑到边的数量远远小于点的数量)。
作为优选,所述数据预加载机制采用LRU灵活的缓存过期策略,实现既能保证热点数据缓存不丢失,又能保证过期数据删除释放缓存的效果。
更优地,所述LRU灵活的缓存过期策略具体如下:
缓存使用量达到阈值时,清除缓存中使用最古老的数据;同时新查询数据时,存放进入缓存生命周期队列的70%的地方,防止刷库操作;其中,阀值根据使用场景进行自助配置。
作为优选,所述查询的流程如下:
(1)、所有Edge信息保存在Driver节点,由于边的数量小于点的数量,故存储在一个节点(未进行分布式处理);
(2)、每次查询请求经过Driver节点,根据点的ID,哈希找到数据所在分片,进行相应数据的查询有关处理;
(3)、主索引采用srcId+edgeId+tarId的结构存储,保证点和点的索引信息在一个分片,减少查询的网络开销;
(4)、采用数据的预加载机制,查询节点数据的1度关系的节点索引信息,在节点的查询过程中,采用异步的方式,预先加载进入所在节点的内存(节点查询之后,相邻节点的查询概率较大);
(5)、数据的预加载机制采用LRU的缓存过期策略,缓存使用量达到阈值时,清除缓存中使用最古老的数据;同时新查询数据时,存放进入缓存生命周期队列的70%的地方,防止刷库操作;
(6)、Driver与数据存储节点之间采用task的形式交互,即Driver把节点的操作包装为Task,分发到相应分片节点上进行处理,再返回Driver数据。
更优地,所述数据的实时新增过程如下:
①、节点数据:Driver节点根据节点的ID路由保存节点信息到对应的节点分片;
②、边数据:Driver节点存储边信息,同时根据边的初始节点的ID路由保存初始节点ID+边ID+目标节点ID的主索引到对应的节点分片。
本发明的针对多种使用场景的图数据存储模型和结构的定义方法具有以下优点:
(一)结合当前实际中的应用场景,针对所用图数据库的数据分布不均等问题,本发明解决数据的均衡分布,关系数据的高效查询与分析,同时满足数据的实时增、删、改的使用场景;
(二)本发明,解决大数据量下,图数据的分布式存储以及加快图数据的查询和实时增删改问题,满足我们多数场景的使用需求;
(三)本发明围绕主索引数据为核心,点数据和边数据集成使用的思想,满足不同查询场景的使用;
(四)本发明的Driver节点作为驱动节点,配合多个数据节点进行使用,提高查询的效率;
(五)本发明采用数据预加载机制,对热点数据进行缓存,减少查询和计算的时间;
(六)本发明以结构化的方式存储非结构化的图数据,实现数据实时的增删改,满足数据的实时性;
(七)本发明采用灵活的LRU缓存过期策略,实现既能保证热点数据缓存不丢失,又能保证过期数据删除释放缓存的效果;
(八)本发明主要引入了多节点存储和操作数据,加快数据的处理能力和存储容量,同时图数据结构化存储,满足图数据的实时增删改操作,预加载的引用,保证数据的查询效率等等。
附图说明
下面结合附图对本发明进一步说明。
附图1为针对多种使用场景的图数据存储模型和结构的定义方法的结构示意图;
附图2为查询的流程的结构示意图;
附图3为LRU缓存过期策略的示意图。
具体实施方式
参照说明书附图和具体实施例对本发明的一种针对多种使用场景的图数据存储模型和结构的定义方法作以下详细地说明。
实施例:
如附图1所示,本发明的针对多种使用场景的图数据存储模型和结构的定义方法,该方法包括:
S1、采用主索引+点数据+边数据分离存储的存储结构,围绕主索引数据为核心,点数据和边数据集成使用的思想,满足不同查询场景的使用;
S2、采用Driver节点与数据节点相结合的方式,Driver节点作为驱动节点,配合多个数据节点进行使用,提高查询的效率;
S3、采用数据预加载机制,对热点数据进行缓存,减少查询和计算的时间;
S4、图数据存储结构化,以结构化的方式存储非结构化的图数据,实现数据实时的增删改,满足数据的实时性。
步骤S1中,主索引是指数据存储时,维护一份srcId+edgeId+tarId为索引的主索引数据,主索引数据根据srcId进行哈希分片,保证索引与数据信息在一个分片。
点数据中点的详细信息存储的物理文件,根据点的ID进行哈希分片。
边数据中边的详细信息存储的物理文件,边的存储暂时未做分片(考虑到边的数量远远小于点的数量)。
其中,主索引与点数据为不同的数据,依据主索引只是维护出发节点、目标节点与对应边的ID信息,具体的节点详情维护在分片中,边详情维护在Driver中;当进行增删改的写操作时,就可以快速定位数据的存储位置而进行相应操作,达到准实时的目的;最终可以理解为以非结构化的方式来存储结构化的数据。
步骤S3中,数据预加载机制采用LRU灵活的缓存过期策略,实现既能保证热点数据缓存不丢失,又能保证过期数据删除释放缓存的效果。如附图3所示,LRU灵活的缓存过期策略具体如下:
缓存使用量达到阈值时,清除缓存中使用最古老的数据;同时新查询数据时,存放进入缓存生命周期队列的70%的地方,防止刷库操作;其中,阀值根据使用场景进行自助配置。
其中,如附图2所示,查询的流程如下:
(1)、所有Edge信息保存在Driver节点,由于边的数量小于点的数量,故存储在一个节点(未进行分布式处理);
(2)、每次查询请求经过Driver节点,根据点的ID,哈希找到数据所在分片,进行相应数据的查询有关处理;
(3)、主索引采用srcId+edgeId+tarId的结构存储,保证点和点的索引信息在一个分片,减少查询的网络开销;
(4)、采用数据的预加载机制,查询节点数据的1度关系的节点索引信息,在节点的查询过程中,采用异步的方式,预先加载进入所在节点的内存(节点查询之后,相邻节点的查询概率较大);
(5)、数据的预加载机制采用LRU的缓存过期策略,缓存使用量达到阈值时,清除缓存中使用最古老的数据;同时新查询数据时,存放进入缓存生命周期队列的70%的地方,防止刷库操作;
(6)、Driver与数据存储节点之间采用task的形式交互,即Driver把节点的操作包装为Task,分发到相应分片节点上进行处理,再返回Driver数据。
查询简化流程:节点ID—>Driver节点路由到对应的节点分片返回数据;
节点ID—>Driver节点路由到对应的节点分片返回主索引,然后Driver节点根据主索引对应的边ID查询对应的边数据返回;
数据的实时新增过程如下:
①、节点数据:Driver节点根据节点的ID路由保存节点信息到对应的节点分片;
②、边数据:Driver节点存储边信息,同时根据边的初始节点的ID路由保存初始节点ID+边ID+目标节点ID的主索引到对应的节点分片。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (4)

1.一种针对多种使用场景的图数据存储模型和结构的定义方法,其特征在于,该方法包括:
采用主索引 + 点数据 + 边数据分离存储的存储结构,围绕主索引数据为核心,点数据和边数据集成使用的思想,满足不同查询场景的使用;
采用Driver节点与数据节点相结合的方式,Driver节点作为驱动节点,配合多个数据节点进行使用,提高查询的效率;
采用数据预加载机制,对热点数据进行缓存,减少查询和计算的时间;
图数据存储结构化,以结构化的方式存储非结构化的图数据,实现数据实时的增删改,满足数据的实时性;
其中,主索引是指数据存储时,维护一份srcId + edgeId + tarId为索引的主索引数据,主索引数据根据srcId进行哈希分片,保证索引与数据信息在一个分片;
点数据中点的详细信息存储的物理文件,根据点的ID进行哈希分片;
边数据中边的详细信息存储的物理文件,边的存储暂时未做分片;
查询的流程如下:
(1)、所有Edge信息保存在Driver节点,由于边的数量小于点的数量,故存储在一个节点;
(2)、每次查询请求经过Driver节点,根据点的ID,哈希找到数据所在分片,进行相应数据的查询有关处理;
(3)、主索引采用srcId + edgeId + tarId的结构存储,保证点和点的索引信息在一个分片,减少查询的网络开销;
(4)、采用数据的预加载机制,查询节点数据的1度关系的节点索引信息,在节点的查询过程中,采用异步的方式,预先加载进入所在节点的内存;
(5)、数据的预加载机制采用LRU的缓存过期策略,缓存使用量达到阈值时,清除缓存中使用最古老的数据;同时新查询数据时,存放进入缓存生命周期队列的70%的地方,防止刷库操作;
(6)、Driver与数据存储节点之间采用task的形式交互,即Driver把节点的操作包装为Task,分发到相应分片节点上进行处理,再返回Driver数据。
2.根据权利要求1所述的针对多种使用场景的图数据存储模型和结构的定义方法,其特征在于,所述数据预加载机制采用LRU灵活的缓存过期策略,实现既能保证热点数据缓存不丢失,又能保证过期数据删除释放缓存的效果。
3.根据权利要求2所述的针对多种使用场景的图数据存储模型和结构的定义方法,其特征在于,所述LRU灵活的缓存过期策略具体如下:
缓存使用量达到阈值时,清除缓存中使用最古老的数据;同时新查询数据时,存放进入缓存生命周期队列的70%的地方,防止刷库操作;其中,阀值根据使用场景进行自助配置。
4.根据权利要求1所述的针对多种使用场景的图数据存储模型和结构的定义方法,其特征在于,所述数据的实时新增过程如下:
①、节点数据:Driver节点根据节点的ID路由保存节点信息到对应的节点分片;
②、边数据:Driver节点存储边信息,同时根据边的初始节点的ID路由保存初始节点ID+边ID+目标节点ID的主索引到对应的节点分片。
CN201911211045.2A 2019-12-02 2019-12-02 针对多种使用场景的图数据存储模型和结构的定义方法 Active CN110941619B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911211045.2A CN110941619B (zh) 2019-12-02 2019-12-02 针对多种使用场景的图数据存储模型和结构的定义方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911211045.2A CN110941619B (zh) 2019-12-02 2019-12-02 针对多种使用场景的图数据存储模型和结构的定义方法

Publications (2)

Publication Number Publication Date
CN110941619A CN110941619A (zh) 2020-03-31
CN110941619B true CN110941619B (zh) 2023-05-16

Family

ID=69908717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911211045.2A Active CN110941619B (zh) 2019-12-02 2019-12-02 针对多种使用场景的图数据存储模型和结构的定义方法

Country Status (1)

Country Link
CN (1) CN110941619B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022000375A1 (en) * 2020-07-01 2022-01-06 Paypal, Inc. Graph storage in database
CN112685419B (zh) * 2020-12-31 2021-09-10 北京赛思信安技术股份有限公司 一种可保持janusGraph数据一致性的分布式高效并行加载方法
CN113672590B (zh) * 2021-07-22 2024-06-07 浙江大华技术股份有限公司 一种数据清理方法、图数据库装置和计算机可读存储介质
CN113779286B (zh) * 2021-11-11 2022-02-08 支付宝(杭州)信息技术有限公司 管理图数据的方法及装置
CN114791968A (zh) * 2022-06-27 2022-07-26 杭州连通图科技有限公司 用于图计算的处理方法、装置、系统及计算机可读介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521406A (zh) * 2011-12-26 2012-06-27 中国科学院计算技术研究所 海量结构化数据复杂查询任务的分布式查询方法和系统
CN105488191A (zh) * 2015-12-03 2016-04-13 南京联成科技发展有限公司 一种基于大数据的信息安全管理运维服务平台的数据采集处理方法及装置
WO2017050014A1 (zh) * 2015-09-21 2017-03-30 北京奇虎科技有限公司 一种数据存储处理方法和装置
WO2017114164A1 (zh) * 2015-12-28 2017-07-06 阿里巴巴集团控股有限公司 一种图数据的处理方法和装置
CN109670089A (zh) * 2018-12-29 2019-04-23 颖投信息科技(上海)有限公司 知识图谱系统及其图服务器
CN110516119A (zh) * 2019-08-27 2019-11-29 西南交通大学 一种自然资源场景数据的组织调度方法、装置和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015094179A1 (en) * 2013-12-17 2015-06-25 Hewlett-Packard Development Company, L.P. Abstraction layer between a database query engine and a distributed file system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521406A (zh) * 2011-12-26 2012-06-27 中国科学院计算技术研究所 海量结构化数据复杂查询任务的分布式查询方法和系统
WO2017050014A1 (zh) * 2015-09-21 2017-03-30 北京奇虎科技有限公司 一种数据存储处理方法和装置
CN105488191A (zh) * 2015-12-03 2016-04-13 南京联成科技发展有限公司 一种基于大数据的信息安全管理运维服务平台的数据采集处理方法及装置
WO2017114164A1 (zh) * 2015-12-28 2017-07-06 阿里巴巴集团控股有限公司 一种图数据的处理方法和装置
CN109670089A (zh) * 2018-12-29 2019-04-23 颖投信息科技(上海)有限公司 知识图谱系统及其图服务器
CN110516119A (zh) * 2019-08-27 2019-11-29 西南交通大学 一种自然资源场景数据的组织调度方法、装置和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李高超 ; 李卢毓海 ; 刘梦雅 ; 刘燕兵 ; .基于二级索引结构的图压缩算法.通信学报.2018,(06),全文. *
段慧芳 ; 汤小春 ; .基于路径索引的密集邻域图数据查询方法研究.计算机应用研究.2017,(12),全文. *

Also Published As

Publication number Publication date
CN110941619A (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
CN110941619B (zh) 针对多种使用场景的图数据存储模型和结构的定义方法
US10346432B2 (en) Compaction policy
EP2924594B1 (en) Data encoding and corresponding data structure in a column-store database
US8229968B2 (en) Data caching for distributed execution computing
WO2017219848A1 (zh) 分布式数据库中id的处理方法、管理系统及服务器
JP2015225656A (ja) 分散型データグラフ記憶システム及び方法
US10394782B2 (en) Chord distributed hash table-based map-reduce system and method
US20070214320A1 (en) Multi-cache cooperation for response output caching
CN108182213A (zh) 一种基于分布式系统的数据处理优化装置及方法
Xing et al. A distributed multi-level model with dynamic replacement for the storage of smart edge computing
CN107249035B (zh) 一种等级动态可变的共享重复数据存储和读取方法
CN107004013A (zh) 用于使用基于硬件的处理来提供分布式树遍历的系统和方法
CN107368608A (zh) 基于arc替换算法的hdfs小文件缓存管理方法
CN104246720B (zh) 确定用于去重复的段边界
CN110427386A (zh) 数据处理方法、装置及计算机存储介质
CN107656701A (zh) 小文件读加速方法、系统、装置及计算机可读存储介质
CN105471893B (zh) 一种分布式等值数据流连接方法
CN116089414A (zh) 基于海量数据场景的时序数据库写入性能优化方法及装置
CN112799590B (zh) 一种针对在线主存储重删的差异化缓存方法
US20190087445A1 (en) Method of facilitating distributed data search in a federated cloud and system thereof
US11836095B2 (en) Forwarding incoming IO to SCM namespaces
Alikhan et al. Dingo optimization based network bandwidth selection to reduce processing time during data upload and access from cloud by user
Ibrahim et al. INTELLIGENT COOPERATIVE WEB CACHING POLICIES FOR MEDIA OBJECTS BASED ON J48 DECISION TREE AND NAÃ VE BAYES SUPERVISED MACHINE LEARNING ALGORITHMS IN STRUCTURED PEER-TO-PEER SYSTEMS
CN116760661A (zh) 数据存储方法、装置、计算机设备、存储介质和程序产品
CN110765319A (zh) 一种提高Janusgraph路径探索性能的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 271000 Langchao science and Technology Park, 527 Dongyue street, Tai'an City, Shandong Province

Applicant after: INSPUR SOFTWARE Co.,Ltd.

Address before: No. 1036, Shandong high tech Zone wave road, Ji'nan, Shandong

Applicant before: INSPUR SOFTWARE Co.,Ltd.

GR01 Patent grant
GR01 Patent grant