CN109344259A - 一种基于多层划分框架的rdf分布式存储方法 - Google Patents

一种基于多层划分框架的rdf分布式存储方法 Download PDF

Info

Publication number
CN109344259A
CN109344259A CN201810803364.1A CN201810803364A CN109344259A CN 109344259 A CN109344259 A CN 109344259A CN 201810803364 A CN201810803364 A CN 201810803364A CN 109344259 A CN109344259 A CN 109344259A
Authority
CN
China
Prior art keywords
vertex
rdf
algorithm
follows
rdf graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810803364.1A
Other languages
English (en)
Other versions
CN109344259B (zh
Inventor
刘均
王瑞杰
晋毓泽
张铎
魏笔凡
王萌
姚思雨
曾宏伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201810803364.1A priority Critical patent/CN109344259B/zh
Publication of CN109344259A publication Critical patent/CN109344259A/zh
Application granted granted Critical
Publication of CN109344259B publication Critical patent/CN109344259B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于多层划分框架的RDF分布式存储方法,主要步骤包括:(1)通过MMA算法优化RDF图中的顶点移动,保护了RDF图中小社团;(2)通过MSLM算法对RDF图进行粗糙化,发现了RDF图中的社团结构,并且在此基础了缩小了RDF数据的规模;(3)通过B_AP算法实现了对RDF图的k‑way分割,使得各个物理存储节点之间的数据量相对平衡并且降低了节点之间的通信代价。本发明提出了完整的RDF分布式存储方法,为提升RDF的查询效率奠定了基础。

Description

一种基于多层划分框架的RDF分布式存储方法
技术领域
本发明属于分布式存储领域,具体涉及一种基于多层划分框架的RDF分布式存储方法。
背景技术
随着语义网的高速发展,RDF(Resource Description Framework)作为语义网的核心标准也呈现爆炸式的增长,对大规模RDF数据的存储和查询管理成为了当前研究的热点。传统基于单机的RDF存储和查询由于数据扩展性差等问题在面对超大规模的RDF数据时难以管理,所以基于分布式的RDF存储和查询成为了研究趋势,而如何更好地将RDF分割且进行分布式查询成为了在分布式系统上对RDF研究的重点。
分布式系统和云计算平台因为存储空间大,可扩展性强等优势而在各个领域取得长足发展。而RDF数据集的日渐增长也使得对RDF的存储和查询的研究在近些年来越来越多地向基于分布式系统或者云计算平台发展。分布式系统存储RDF图数据主要涉及到在分布式环境下的布局形式,分割算法,冗余算法等诸多问题。现有的RDF分布式存储技术主要包括基于哈希的RDF分割方法,基于键值对的RDF分割方法,基于图模型的RDF分割方法和基于多层划分框架的RDF分割方法,其中当前最为流行的就是基于多层划分框架思想的RDF分割方法。
针对RDF分布式存储方法,申请人通过查询,检索到2篇与本发明相关的发明专利:
(1)一种分布式层次化的RDF数据的存储方法,申请号:201310658588.5;该专利公开了一种分布式层次化的RDF数据的存储方法,包括:对所有RDF数据进行索引;采用两个存储层以存储索引后的RDF数据,从底层到上层依次为:持久化存储层和分布式内存存储层;所有RDF数据首先存储到持久化存储层,然后,将常用的RDF数据存储到分布式内存存储层;将所有存储在持久化存储层的RDF数据自动保持多个备份;当检测到分布式内存存储层的节点发生数据失效时,在下次查询到该节点中的RDF数据时,从持久化存储层去获取相应的数据。
(2)一种高效的分布式的RDF数据存储方法,申请号:201610064516.1;该专利公开了一种高效的分布式的RDF数据存储方法。包括:1)用户为待上传的每一三元组选取一命名图或设定一新的命名图;并根据业务需求为该三元组设定一有效谓词及其三元组;2)数据控制系统对用户上传的RDF数据中的每条三元组进行解析,提取该三元组的谓词及该三元组的命名图的有效谓词;然后根据该有效谓词,将该三元组拆分成具有相同唯一标识的两个三元组:同一主语的完整谓词的三元组和同一主语的有效谓词的三元组;有效谓词为完整谓词中一部分谓词;3)数据控制系统将得到的同一主语的完整谓词的三元组数据和同一主语的有效谓词的三元组数据分别存储到不同的数据库集群。
上述的两个专利方案中均没有从宏观上考虑RDF的社团特性与分布式系统的通信代价问题,从而可能导致各个物理节点之间交叉边数目过多而使得查询效率下降,无法达到高效存储的目的。
发明内容
本发明的目的在于提供一种基于多层划分框架的RDF分布式存储方法,以克服现有技术存在的物理节点之间低平衡性与高通信代价的缺陷。
本发明采用如下技术方案来实现的:
一种基于多层划分框架的RDF分布式存储方法,该方法通过MMA算法和MSLM算法实现对RDF图的粗糙化,通过B_AP算法实现对RDF图的k-way分割,具体步骤如下:
Step1执行以下初始化操作:
101)RDF图的初始化:设RDF三元组的主语集合为Ts,谓语集合为Tp,宾语集合为To,那么定于RDF图为:G=(V,E),其中V={v|v∈Ts∪To},并且假设n=|V|表示RDF图中顶点的个数,m=|E|表示RDF图边的数量;
102)数据预处理:将RDF数据的N-Triple型数据集全部处理为图格式,为后续在RDF图上的算法运行做准备;
Step2通过MMA算法首先对RDF图的顶点移动进行优化:在MMA算法中设定ε∈[β,0.5),其中0<β<0.5,当模块度的增值大于ε,进行移动顶点;
Step3通过MSLM算法对RDF图进行粗糙化:基于模块度的MSLM算法将RDF图的规模进行压缩,达到粗糙化RDF图的目的,其具体的优化步骤如下:
301)RDF图中存在大量的属性节点,其入度都为1,所以本文认为将RDF图中所有的入度为1的顶点都等同于属性节点,即在算法运算过程,如果节点的入度为1,直接跳过进行下一个顶点的运算;
302)RDF图中存在着大量小社团,但是在模块度增加的情况下不断被吞并,所以设置浮动参数来调节保护小社团的存在;
Step4通过B_AP算法对RDF图进行k-way分割,实现分割的平衡性和最小边割的目标。
本发明进一步的改进在于,Step2中所述的MMA算法描述如下:
假设顶点v从c1移动c2到了,则对于c1和c2的模块度的变化如下:
式中E(c1)和E(c2)表示粗糙子图c1和c2中的边数,而表示粗糙子图中c1和c2顶点v的邻居顶点;所以,模块度增值ΔQ的计算公式如下:
ΔQ=ΔQ1+ΔQ2 (7)。
本发明进一步的改进在于,Step3中所述的MSLM算法描述如下:
对于RDF图运行MSLM算法后,计算模块度值变量ΔQ',假设计算社团c1的某个顶点vi进行移动,其模块度变化计算公式如下:
式中,ωin(vi)表示由顶点vi入射社团c1的权重之和,∑tot表示入射社团c1的总权重,而ω(vi)表示顶点vi的总权重。
本发明进一步的改进在于,Step4中的具体实现步骤描述如下:
401)定义新的相似度:为了体现RDF图中顶点的相似度与边的权重成比例,使用一个线性函数转换来标准化相似度,公式如下:
式中MAX表示图中顶点中权值的最大值,而MIN表示权值的最小值;
402)初选聚类中心:运用顶点密度作为筛选备选的聚类中心的条件,如果顶点vi所有邻居顶点的顶点密度都较小而且顶点vi与其他的顶点密度较高的顶点关系疏远,那么顶点将会被当作备选的聚类中心;顶点密度的计算公式如下:
式中dc是截止距离,满足数据集中所有数据顶点的1%到2%的邻居顶点的平均值;
403)为了使得最终的聚类之间的边割最小,引入了一个目标函数f(P);当目标函数收敛的时候,表示聚类之间的相似度最小,而各个聚类中心内部的相似度达到最大,目标函数f(P)的计算公式如下:
式中,a(Pi,Pj)表示两个聚类之间的相似度值,其计算公式如下:
404)平衡策略:为了实现各个聚类中顶点数目的平衡,每个聚类需要设置最大容量限制,当在迭代过程中某个聚类中的顶点数目超过了限制,将通过聚类中各个顶点的相似度做出相应的调整。
本发明进一步的改进在于,步骤404)的具体实现步骤如下:
a)在各个聚类中计算所有内部顶点与聚类中心之间的相似度,然后按降序进行排序;
b)寻找一个最小的顶点集,这个顶点集的权重总和与相似度总和都要比新的顶点小;
c)如果存在这样一个顶点集,则用新的顶点将其替换;
d)如果不存在,则将新的顶点分配到次优化的聚类之中。
本发明进一步的改进在于,Step4中所述的B_AP算法描述如下:
a)输入相似度矩阵S、RDF图分割数k和平衡因子α,并且初始化RDF粗糙化图C;
b)从粗糙化图C中筛选出潜在的聚类中心集合o,调整参数p直到选出k个聚类中心为止;
c)计算最小边割的目标函数,并且循环遍历图中的节点vi并且计算相似度最大值;
d)如果顶点vi满足物理存储节点的容量限制,则将vi分配给相应的聚类;否则,则采用平衡策略进行调整;
e)循环上述步骤,直到最小边割目标函数收敛,算法结束。
本发明具有如下有益的技术效果:
本发明基于多层划分框架对RDF图进行了分布式分割存储。在多层划分框架的第一步中,实现了对RDF图的粗糙化,减少了RDF图的规模,并且挖掘了其中的社团特性,为第二步分割做好了准备。在多层划分框架中的第二步中,实现了平衡分割,即保证了每个分割之间的数据量差别稳定在一个可以控制的范围,使得分布式系统查询可以并行进行;此外在保证平衡性的情况下,实现了各分割之间的最小边切,使得各个物理存储节点之间的通信代价最小,提高了存储查询效率。
附图说明
图1是本发明所提出的基于多层划分框架的RDF分布式存储方法的流程图。
图2是本发明所提出的MMA算法的流程图。
图3是本发明所提出的MSLM算法的流程图。
图4是MSLM算法具体的RDF粗糙化示例图。
图5是本发明所提出的B_AP算法的流程图。
具体实施方式
以下结合附图及实施例对本发明作进一步的详细说明。
如图1所示,本发明提供的基于多层划分框架的RDF分布式存储方法,该方法通过MMA算法和MSLM算法实现对RDF图的粗糙化,通过B_AP算法实现对RDF图的k-way分割,具体步骤如下:
Step1执行以下初始化操作:
101)RDF图的初始化:设RDF三元组的主语集合为Ts,谓语集合为Tp,宾语集合为To,那么定于RDF图为:G=(V,E),其中V={v|v∈Ts∪To},并且假设n=|V|表示RDF图中顶点的个数,m=|E|表示RDF图边的数量。
102)数据预处理:将RDF数据的N-Triple型数据集全部处理为图格式,为后续在RDF图上的算法运行做准备。
Step2通过MMA算法首先对RDF图的顶点移动进行优化:在MMA算法中设定ε∈[β,0.5),其中0<β<0.5。当模块度的增值大于ε,在移动顶点。MMA算法描述如图2所示:
重点说明模块度增值ΔQ是如何计算的,假设顶点v从c1移动c2到了,则对于c1和c2的模块度的变化如下:
式中E(c1)和E(c2)表示粗糙子图c1和c2中的边数,而表示粗糙子图中c1和c2顶点v的邻居顶点。所以,ΔQ的计算公式如下:
ΔQ=ΔQ1+ΔQ2 (3)
Step3通过MSLM算法对RDF图进行粗糙化:基于模块度的MSLM算法将RDF图的规模进行压缩,达到粗糙化RDF图的目的,其具体的优化步骤如下:
301)RDF图中存在大量的属性节点,其入度都为1,所以本文认为将RDF图中所有的入度为1的顶点都等同于属性节点,即在算法运算过程,如果节点的入度为1,直接跳过进行下一个顶点的运算;
302)RDF图中存在着大量小社团,但是在模块度增加的情况下不断被吞并,所以设置浮动参数来调节保护小社团的存在;
如图3所示,MSLM算法描述如下:
对于RDF图运行MSLM算法后,计算模块度值变量ΔQ',假设计算社团c1的某个顶点vi进行移动,其模块度变化计算公式如下:
式中,ωin(vi)表示由顶点vi入射社团c1的权重之和,∑tot表示入射社团c1的总权重,而ω(vi)表示顶点vi的总权重。
图4展示了MSLM算法粗糙化图的一个示例,在每轮迭代中,MSLM根据模块度的值将关系密切的顶点划分在同一个社团,并在下次迭代中将这些顶点粗糙化一个顶点,并重复上面的过程。而粗糙化顶点之间的边的权值则是不同社团之间所有边的数量的总和。在(d)中,将在(c)中的A拆分为A1和A2,即在(c)中的迭代过程中,A中再次调用MMA算法,使得A社团拆分,达到了局部最优的效果,同时也保证了全局最优。
Step4通过B_AP算法对RDF图进行k-way分割,实现分割的平衡性和最小边割的目标。B_AP算法改进的具体描述如下:
401)定义新的相似度:为了体现RDF图中顶点的相似度与边的权重成比例,本发明提出了使用一个线性函数转换来标准化相似度,公式如下:
式中MAX表示图中顶点中权值的最大值,而MIN表示权值的最小值。
402)初选聚类中心:本发明运用顶点密度作为筛选备选的聚类中心的条件。如果顶点vi所有邻居顶点的顶点密度都较小而且顶点vi与其他的顶点密度较高的顶点关系疏远,那么顶点将会被当作备选的聚类中心。顶点密度的计算公式如下:
式中dc是截止距离,满足数据集中所有数据顶点的1%到2%的邻居顶点的平均值。
403)为了使得最终的聚类之间的边割最小,本发明引入了一个目标函数f(P)。当目标函数收敛的时候,表示聚类之间的相似度最小,而各个聚类中心内部的相似度达到最大,目标函数f(P)的计算公式如下:
式中,a(Pi,Pj)表示两个聚类之间的相似度值,其计算公式如下:
404)平衡策略:为了实现各个聚类中顶点数目的平衡,每个聚类需要设置最大容量限制。当AP聚类算法在迭代过程中某个聚类中的顶点数目超过了限制,将通过聚类中各个顶点的相似度做出相应的调整,步骤如下:
a)在各个聚类中计算所有内部顶点与聚类中心之间的相似度,然后按降序进行排序;
b)寻找一个最小的顶点集,这个顶点集的权重总和与相似度总和都要比新的顶点小;
c)如果存在这样一个顶点集,则用新的顶点将其替换;
d)如果不存在,则将新的顶点分配到次优化的聚类之中。
如图5所示,B_AP算法的具体步骤如下:
a)输入相似度矩阵S、RDF图分割数k和平衡因子α,并且初始化RDF粗糙化图C;
b)从粗糙化图C中筛选出潜在的聚类中心集合o,调整参数p直到选出k个聚类中心为止;
c)计算最小边割的目标函数,并且循环遍历图中的节点vi并且计算相似度最大值;
d)如果顶点vi满足物理存储节点的容量限制,则将vi分配给相应的聚类;否则,则采用平衡策略进行调整;
e)循环上述步骤,直到最小边割目标函数收敛,算法结束。

Claims (6)

1.一种基于多层划分框架的RDF分布式存储方法,其特征在于,该方法通过MMA算法和MSLM算法实现对RDF图的粗糙化,通过B_AP算法实现对RDF图的k-way分割,具体步骤如下:
Step1执行以下初始化操作:
101)RDF图的初始化:设RDF三元组的主语集合为Ts,谓语集合为Tp,宾语集合为To,那么定于RDF图为:G=(V,E),其中V={v|v∈Ts∪To},并且假设n=|V|表示RDF图中顶点的个数,m=|E|表示RDF图边的数量;
102)数据预处理:将RDF数据的N-Triple型数据集全部处理为图格式,为后续在RDF图上的算法运行做准备;
Step2通过MMA算法首先对RDF图的顶点移动进行优化:在MMA算法中设定ε∈[β,0.5),其中0<β<0.5,当模块度的增值大于ε,进行移动顶点;
Step3通过MSLM算法对RDF图进行粗糙化:基于模块度的MSLM算法将RDF图的规模进行压缩,达到粗糙化RDF图的目的,其具体的优化步骤如下:
301)RDF图中存在大量的属性节点,其入度都为1,所以本文认为将RDF图中所有的入度为1的顶点都等同于属性节点,即在算法运算过程,如果节点的入度为1,直接跳过进行下一个顶点的运算;
302)RDF图中存在着大量小社团,但是在模块度增加的情况下不断被吞并,所以设置浮动参数来调节保护小社团的存在;
Step4通过B_AP算法对RDF图进行k-way分割,实现分割的平衡性和最小边割的目标。
2.根据权利要求1所述的基于多层划分框架的RDF分布式存储方法,其特征在于,Step2中所述的MMA算法描述如下:
假设顶点v从c1移动c2到了,则对于c1和c2的模块度的变化如下:
式中E(c1)和E(c2)表示粗糙子图c1和c2中的边数,而表示粗糙子图中c1和c2顶点v的邻居顶点;所以,模块度增值ΔQ的计算公式如下:
ΔQ=ΔQ1+ΔQ2 (7)。
3.根据权利要求2所述的基于多层划分框架的RDF分布式存储方法,其特征在于,Step3中所述的MSLM算法描述如下:
对于RDF图运行MSLM算法后,计算模块度值变量ΔQ',假设计算社团c1的某个顶点vi进行移动,其模块度变化计算公式如下:
式中,ωin(vi)表示由顶点vi入射社团c1的权重之和,∑tot表示入射社团c1的总权重,而ω(vi)表示顶点vi的总权重。
4.根据权利要求3所述的基于多层划分框架的RDF分布式存储方法,其特征在于,Step4中的具体实现步骤描述如下:
401)定义新的相似度:为了体现RDF图中顶点的相似度与边的权重成比例,使用一个线性函数转换来标准化相似度,公式如下:
式中MAX表示图中顶点中权值的最大值,而MIN表示权值的最小值;
402)初选聚类中心:运用顶点密度作为筛选备选的聚类中心的条件,如果顶点vi所有邻居顶点的顶点密度都较小而且顶点vi与其他的顶点密度较高的顶点关系疏远,那么顶点将会被当作备选的聚类中心;顶点密度的计算公式如下:
式中dc是截止距离,满足数据集中所有数据顶点的1%到2%的邻居顶点的平均值;
403)为了使得最终的聚类之间的边割最小,引入了一个目标函数f(P);当目标函数收敛的时候,表示聚类之间的相似度最小,而各个聚类中心内部的相似度达到最大,目标函数f(P)的计算公式如下:
式中,a(Pi,Pj)表示两个聚类之间的相似度值,其计算公式如下:
404)平衡策略:为了实现各个聚类中顶点数目的平衡,每个聚类需要设置最大容量限制,当在迭代过程中某个聚类中的顶点数目超过了限制,将通过聚类中各个顶点的相似度做出相应的调整。
5.根据权利要求4所述的基于多层划分框架的RDF分布式存储方法,其特征在于,步骤404)的具体实现步骤如下:
a)在各个聚类中计算所有内部顶点与聚类中心之间的相似度,然后按降序进行排序;
b)寻找一个最小的顶点集,这个顶点集的权重总和与相似度总和都要比新的顶点小;
c)如果存在这样一个顶点集,则用新的顶点将其替换;
d)如果不存在,则将新的顶点分配到次优化的聚类之中。
6.根据权利要求4所述的基于多层划分框架的RDF分布式存储方法,其特征在于,Step4中所述的B_AP算法描述如下:
a)输入相似度矩阵S、RDF图分割数k和平衡因子α,并且初始化RDF粗糙化图C;
b)从粗糙化图C中筛选出潜在的聚类中心集合o,调整参数p直到选出k个聚类中心为止;
c)计算最小边割的目标函数,并且循环遍历图中的节点vi并且计算相似度最大值;
d)如果顶点vi满足物理存储节点的容量限制,则将vi分配给相应的聚类;否则,则采用平衡策略进行调整;
e)循环上述步骤,直到最小边割目标函数收敛,算法结束。
CN201810803364.1A 2018-07-20 2018-07-20 一种基于多层划分框架的rdf分布式存储方法 Active CN109344259B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810803364.1A CN109344259B (zh) 2018-07-20 2018-07-20 一种基于多层划分框架的rdf分布式存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810803364.1A CN109344259B (zh) 2018-07-20 2018-07-20 一种基于多层划分框架的rdf分布式存储方法

Publications (2)

Publication Number Publication Date
CN109344259A true CN109344259A (zh) 2019-02-15
CN109344259B CN109344259B (zh) 2022-02-22

Family

ID=65291673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810803364.1A Active CN109344259B (zh) 2018-07-20 2018-07-20 一种基于多层划分框架的rdf分布式存储方法

Country Status (1)

Country Link
CN (1) CN109344259B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110034A (zh) * 2019-05-10 2019-08-09 天津大学深圳研究院 一种基于图的rdf数据管理方法、装置及存储介质
CN110543585A (zh) * 2019-08-14 2019-12-06 天津大学 一种基于关系模型的rdf图和属性图统一存储方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102745A (zh) * 2014-07-31 2014-10-15 上海交通大学 基于局部最小边的复杂网络社团挖掘方法
CN104462609A (zh) * 2015-01-06 2015-03-25 福州大学 结合星型图编码的rdf数据存储与查询方法
CN104657418A (zh) * 2014-12-18 2015-05-27 北京航空航天大学 一种基于隶属度传播的复杂网络模糊社团挖掘方法
CN105955999A (zh) * 2016-04-20 2016-09-21 华中科技大学 一种大规模RDF图的ThetaJoin查询处理方法
US20170342457A1 (en) * 2015-06-25 2017-11-30 Ascus Biosciences, Inc. Methods, apparatuses, and systems for analyzing microorganism strains from complex heterogeneous communities, predicting and identifying functional relationships and interactions thereof, and selecting and synthesizing microbial ensembles based thereon

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102745A (zh) * 2014-07-31 2014-10-15 上海交通大学 基于局部最小边的复杂网络社团挖掘方法
CN104657418A (zh) * 2014-12-18 2015-05-27 北京航空航天大学 一种基于隶属度传播的复杂网络模糊社团挖掘方法
CN104462609A (zh) * 2015-01-06 2015-03-25 福州大学 结合星型图编码的rdf数据存储与查询方法
US20170342457A1 (en) * 2015-06-25 2017-11-30 Ascus Biosciences, Inc. Methods, apparatuses, and systems for analyzing microorganism strains from complex heterogeneous communities, predicting and identifying functional relationships and interactions thereof, and selecting and synthesizing microbial ensembles based thereon
CN105955999A (zh) * 2016-04-20 2016-09-21 华中科技大学 一种大规模RDF图的ThetaJoin查询处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈志奎: "《双目标优化的RDF图分割算法》", 《计算机工程与应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110034A (zh) * 2019-05-10 2019-08-09 天津大学深圳研究院 一种基于图的rdf数据管理方法、装置及存储介质
CN110543585A (zh) * 2019-08-14 2019-12-06 天津大学 一种基于关系模型的rdf图和属性图统一存储方法

Also Published As

Publication number Publication date
CN109344259B (zh) 2022-02-22

Similar Documents

Publication Publication Date Title
CN106528773B (zh) 一种基于Spark平台支持空间数据管理的图计算系统及方法
CN108448620B (zh) 基于综合性能指标的高渗透率分布式电源集群划分方法
CN109582758B (zh) 一种Elasticsearch索引分片优化方法
CN108810140B (zh) 云存储系统中基于动态阈值调整的高性能分级存储优化方法
CN110334157B (zh) 一种云计算管理系统
WO2022012093A1 (zh) 一种基于"分区-分级"理论的复杂水资源系统优化配置方法
CN109710774B (zh) 结合平衡策略的图数据划分与分布式存储方法
CN106796589B (zh) 空间数据对象的索引方法和系统
CN102722553A (zh) 基于用户日志分析的分布式倒排索引组织方法
CN109840551B (zh) 一种用于机器学习模型训练的优化随机森林参数的方法
CN110147372A (zh) 一种面向htap的分布式数据库智能混合存储方法
CN111612053A (zh) 一种线损率合理区间的计算方法
CN101996242A (zh) 基于三维r树索引扩展结构的三维城市模型自适应方法
CN109344259A (zh) 一种基于多层划分框架的rdf分布式存储方法
CN104615638A (zh) 一种面向大数据的分布式密度聚类方法
CN101692230A (zh) 顾及多细节层次的三维r树空间索引方法
CN1687932A (zh) 一种用于基于内容的海量图片快速检索的索引构建方法
CN106651000B (zh) 一种基于半监督谱聚类的黑启动分区方法
CN109446230A (zh) 一种光伏发电影响因素的大数据分析系统及方法
CN108416381B (zh) 一种面向三维点集的多密度聚类方法
CN105138536B (zh) 基于有向超图的移动社交网络数据分片方法
CN113407542B (zh) 一种城市路网车辆出行轨迹的检索方法及系统
CN107426315A (zh) 一种基于BP神经网络的分布式缓存系统Memcached的改进方法
CN115662192B (zh) 一种用于航班时刻分配场景的机场时隙防火墙设置方法
CN106780747A (zh) 一种快速分割cfd计算网格的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant