CN117033541A - 一种时空知识图谱索引方法及相关设备 - Google Patents
一种时空知识图谱索引方法及相关设备 Download PDFInfo
- Publication number
- CN117033541A CN117033541A CN202311299795.6A CN202311299795A CN117033541A CN 117033541 A CN117033541 A CN 117033541A CN 202311299795 A CN202311299795 A CN 202311299795A CN 117033541 A CN117033541 A CN 117033541A
- Authority
- CN
- China
- Prior art keywords
- space
- time
- graph
- node
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 239000013598 vector Substances 0.000 claims abstract description 113
- 238000012549 training Methods 0.000 claims abstract description 43
- 238000013138 pruning Methods 0.000 claims abstract description 35
- 238000003062 neural network model Methods 0.000 claims abstract description 21
- 230000004931 aggregating effect Effects 0.000 claims abstract description 12
- 238000004590 computer program Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 12
- 230000002776 aggregation Effects 0.000 claims description 8
- 238000004220 aggregation Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 235000002020 sage Nutrition 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 239000004576 sand Substances 0.000 description 5
- 241000475481 Nebula Species 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- CYTYCFOTNPOANT-UHFFFAOYSA-N Perchloroethylene Chemical compound ClC(Cl)=C(Cl)Cl CYTYCFOTNPOANT-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/322—Trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Abstract
本发明提供了一种时空知识图谱索引方法及相关设备,包括:获取时空节点的时空属性数据,构建3DR索引树;聚合3DR索引树中的每个节点内部包含的所有时空实体,得到超图节点,并将超图节点的二阶子图作为训练数据输入图神经网络模型进行训练,得到子图匹配模型;将获取的查询请求分解得到的查询子图和时空约束输入子图匹配模型进行计算,得到查询子图的嵌入向量以及时空范围参数;对时空属性数据进行剪枝查找每个叶子节点下的时空实体子图,并根据查询子图和子图匹配模型对每个时空实体子图进行剪枝得到时空子图嵌入向量;对比嵌入向量与时空子图嵌入向量在向量空间中的相对位置关系得到查询结果;大幅提升了时空交集查询效率。
Description
技术领域
本发明涉及时空知识图谱管理、检索技术领域,特别涉及一种时空知识图谱索引方法及相关设备。
背景技术
随着人工智能技术的快速发展,知识图谱的不断扩充,如何对数据海量多样的知识图谱建立高效可用的索引结构,尤其针对知识图谱中占比不小的时空信息进行索引,精确快速的满足时空知识查询需求,是实现事件知识图谱、地理知识图谱等时空知识图谱高效应用的重要途径。时空知识图谱以属性图的形式存储了以头实体、尾实体、关系组成的三元组,一个三元组代表一个事实,大量事实组成图结构的知识数据,其中实体可以具有时间或空间属性,例如空间坐标、时间范围、最小包络矩形等,时空知识图谱具有大量的时空属性数据,大大增加了时空域的检索时间,这使得通用的知识图谱索引难以支持日益增长的时空知识查询需求。
现有知识图谱索引按其查询目的可大致分为图特征、节点特征查询两类,其中,节点特征查询包括对图数据中的关键节点的路径查询、关键字查询等,该类查询不涉及复杂的图结构且易于实现,但不能满足复杂的图模式查询,无法支持知识图谱的全部查询需求;图特征查询指的是给定一个数据图及查询图模式,返回一个与查询图模式在图结构、属性及语义上完全一致的子图,即子图匹配问题;针对图索引的子图匹配问题,现有方法对图特征进行了不同视角的挖掘,例如采用路径特征来对图数据进行索引,其枚举所有的N跳路径信息,并使用哈希列表存储所有的路径特征,该方法显然不适用于海量数据,且路径特征无法保留足够多的图结构特征信息,因此剪枝效果较差;还有利用邻域签名的方式解决了路径特征索引在大数据量下的应用问题,但仍存在着剪枝效果差的问题;还有研究一种基于树的图索引,采用基于节点可达性的伪子图同构的方法捕获图结构特征,该方法存在着剪枝效果差、构建时间受节点度数影响大且对图结构的捕捉并不全面等问题;还有通过从海量图数据中挖掘频繁子图进行索引,该类方法在稀疏数据集以及频繁图模式出现较多的数据集上表现较好,但对于多样化的图谱索引能力欠佳;现有技术还有利用知识图谱本身蕴含的丰富的本体语义信息的NeMa算法,该算法是一种顶点相似性的子图匹配算法,该算法将节点和其邻居的语义信息表示为向量,较为完整的保留了图结构信息,能够有效的获取节点的向量表示,但是不考虑查询图和图数据库的结构相似性,对节点间的语义相关性表示较差。
为了解决知识图谱中空间知识的查询检索问题,Riso-Tree模型采用R-Tree等时空索引方法对空间数据单独进行索引,R树是B树向多维空间发展的另一种形式,它将对象空间按范围划分,每个节点都对应一个区域和一个磁盘页,非叶节点的磁盘页中存储其所有子节点的区域范围,非叶节点的所有子节点的区域都落在它的区域范围之内;叶节点的磁盘页中存储其区域范围之内的所有空间对象的外接矩形;是一种动态索引结构,并利用元路径等子图信息增强R-Tree索引的方法增强索引对空间图模式的剪枝能力,利用带有空间属性的空间节点作为锚点,在通过空间过滤和子图过滤的耦合查询后得到候选空间节点,之后依据查询语句的约束条件及空间节点候选集重写查询语句从而得到目标子图;但依赖于提取预先选定的特征,没有充分利用到知识图谱的图结构特征,从而在剪枝能力上表现较差,进而影响了查询效率。此外,大多索引方法需要保存大量的子图结构信息,在知识图谱海量数据的应用场景下,大大增加了索引文件消耗的存储空间,且没有考虑到时空知识图谱的存储图结构及知识语义特征,且设计时并没有考虑时间维度,也不支持时空交集查询等需求。
发明内容
本发明提供了一种时空知识图谱索引方法及相关设备,其目的是为了在减小时空知识图谱索引消耗的存储空间的同时大幅提升具有语义条件的时空交集查询效率。
为了达到上述目的,本发明提供了一种时空知识图谱索引方法,包括:
步骤1,获取图数据库的时空知识图谱中所有时空节点的时空属性数据,基于时空属性数据将每个时空节点与3DR索引树的节点进行连接,构建3DR索引树,每个时空节点中包含有多个时空实体;
步骤2,针对3DR索引树中的每个节点,将节点内部包含的所有时空实体进行聚合,得到超图节点,并将超图节点的二阶子图作为训练数据;
步骤3,将训练数据输入图神经网络模型进行训练,得到子图匹配模型并存入索引文件中,子图匹配模型用于比对查询子图与每个叶子节点下的时空实体子图的嵌入向量在向量空间的相对位置关系;
步骤4,将获取的查询请求进行分解,得到查询子图和时空约束,将查询子图和时空约束输入子图匹配模型进行计算,得到查询子图的嵌入向量以及时空范围参数,时空范围参数包括时空约束下的最小时空坐标和最大时空坐标;
步骤5,通过3DR索引树对所有时空节点中的时空属性数据进行剪枝,在3DR索引树中查找与每个对应的时空节点下的时空实体子图,并根据查询子图和子图匹配模型对每个叶子节点下的时空实体子图进行剪枝,得到每个叶子节点下的时空实体子图的时空子图嵌入向量;
步骤6,对比查询子图的嵌入向量与每个叶子节点下的时空实体子图的时空子图嵌入向量在向量空间中的相对位置关系,依据相对位置关系查询得到查询结果。
进一步来说,步骤1包括:
获取图数据库的时空知识图谱中所有时空节点的时空属性数据,时空属性数据包括时空坐标、时间信息和最小包络矩形,基于时空属性数据获取每个时空节点的时空坐标,每个时空节点中包含有多个时空实体;
基于时空属性数据将每个时空节点与3DR索引树的节点进行连接,将每个时空节点中的时空实体插入3DR索引树的节点;
3DR索引树的根节点为<L,LU,RB,N>,其中L为节点层级,根节点设置为0,LU、RB表示3DR索引树的节点对应的时空范围,N表示时空节点内包含的时空实体数量。
进一步来说,将每个时空节点中的时空实体插入3DR索引树的节点,包括:
从3DR索引树的根节点开始插入时空实体,依据贪婪策略,在3DR索引树的每一层插入时空实体后,依次选择最小包络矩形体积最小的叶子节点以及最包络矩形长宽高之和最小的叶子节点;
当待插入的叶子节点内存放的时空实体数量达到阈值时,将叶子节点中离最小包络矩形的中心点最远的时空实体删除,重新插入3DR索引树的节点中;
若重新插入3DR索引树的节点中时空实体数量大于阈值时,则对该节点进行划分,并通过3DR索引树的关系边将划分好的节点连接至与节点对应的3DR索引树的节点上。
进一步来说,步骤3包括:
通过更改训练数据中各节点内部的属性信息和替换关系类型两种方式生成负样本;
将负样本和训练数据输入图神经网络模型进行训练,利用GraphSage向量聚合思想将在3DR索引树的节点内采样得到的子图嵌入向量进行聚合,得到聚合向量;
将聚合向量赋给3DR索引树的所有节点,并自底向上依次将每层节点的聚合向量进行聚合,得到3DR索引树中各节点的子图信息向量表征并存入索引文件中;
图神经网络模型采用多任务学习方法分别学习子图判别任务和图相似性判别任务,并采用均方误差损失函数对图神经网络模型进行训练,得到子图匹配模型并存入索引文件中。
进一步来说,通过3DR索引树对所有时空节点中的时空属性数据进行剪枝,在3DR索引树中查找与每个叶子节点对应的时空节点下的时空实体子图,包括:
从3DR索引树的根节点开始,设(x,y,z)为查询节点的最小包络矩形的三维坐标,设(X,Y,Z)为3DR索引树中节点的空间范围矩形的三维坐标;
通过3DR索引树对所有时空节点中的时空属性数据进行剪枝;
当且仅当min(x)>min(X)、min(y)>min(Y)、min(z)>min(Z)、max(x)<max(X)、max(y)<max(Y)、max(z)<max(Z)时,在3DR索引树中递归查找到与每个叶子节点对应的时空节点下的时空实体子图。
进一步来说,步骤6包括:
对比查询子图与每个叶子节点下的时空实体子图的时空子图嵌入向量在向量空间中的相对位置关系,通过相对位置关系判断查询子图是否在时空范围内;
当查询子图在时空范围内,且查询子图的嵌入向量在向量空间中满足各维度坐标值小于3DR索引树各节点的子图嵌入向量的各维度坐标值,则对3DR索引树中各节点重复进行剪枝,直到递归到叶子节点,并在3DR索引树中对与叶子节点相关联的时空节点中的所有时空实体进行重复查询,得到以时空实体为锚点的目标子图;
基于目标子图,获取得到同时满足子图关系和时空位置关系的时空节点列表并输入时空节点ID,并基于时空节点ID将时空约束进行转化,得到时空节点ID约束;
依据时空节点ID约束以及查询请求重写查询请求并输入图数据库的时空知识图谱中进行查询,得到查询结果;
当查询子图不在时空范围内,则将查询子图的嵌入向量与每个叶子节点下的时空实体子图的时空子图嵌入向量输入图相似性判别模型进行计算,得到近似查询结果。
本发明还提供了一种时空知识图谱索引装置,包括:
构建模块,用于获取图数据库的时空知识图谱中所有时空节点的时空属性数据,基于时空属性数据将每个时空节点与3DR索引树的节点进行连接,构建3DR索引树,每个时空节点中包含有多个时空实体;
聚合模块,用于针对3DR索引树中的每个节点,将节点内部包含的所有时空实体进行聚合,得到超图节点,并将超图节点的二阶子图作为训练数据;
训练模块,用于将训练数据输入图神经网络模型进行训练,得到子图匹配模型并存入索引文件中,子图匹配模型用于比对查询子图与每个叶子节点下的时空实体子图的嵌入向量在向量空间的相对位置关系;
计算模块,用于将获取的查询请求进行分解,得到查询子图和时空约束,将查询子图和时空约束输入子图匹配模型进行计算,得到查询子图的嵌入向量以及时空范围参数,时空范围参数包括时空约束下的最小时空坐标和最大时空坐标;
剪枝模块,用于通过3DR索引树对所有时空节点中的时空属性数据进行剪枝,在3DR索引树中查找与每个叶子节点对应的时空节点下的时空实体子图,并根据查询子图和子图匹配模型对每个叶子节点下的时空实体子图进行剪枝,得到每个叶子节点下的时空实体子图的时空子图嵌入向量;
查询模块,用于对比查询子图的嵌入向量与每个叶子节点下的时空实体子图的时空子图嵌入向量在向量空间中的相对位置关系,依据相对位置关系查询得到查询结果。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,当该计算机程序被处理器执行时,实现时空知识图谱索引方法。
本发明还提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现时空知识图谱索引方法。
本发明的上述方案有如下的有益效果:
本发明通过获取图数据库的时空知识图谱中所有时空节点的时空属性数据,基于时空属性数据将每个时空节点与3DR索引树的节点进行连接,构建3DR索引树;针对3DR索引树中的每个节点,将节点内部包含的所有时空实体进行聚合,得到超图节点,并将超图节点的二阶子图作为训练数据;将训练数据输入图神经网络模型进行训练,得到子图匹配模型并存入索引文件中;将获取的查询请求进行分解,得到查询子图和时空约束,将查询子图和时空约束输入子图匹配模型进行计算,得到查询子图的嵌入向量以及时空范围参数;通过3DR索引树对所有时空节点中的时空属性数据进行剪枝,在3DR索引树中查找与每个叶子节点对应的时空节点下的时空实体子图,并根据查询子图和子图匹配模型对每个叶子节点下的时空实体子图进行剪枝,得到每个叶子节点下的时空实体子图的时空子图嵌入向量;对比查询子图的嵌入向量与每个叶子节点下的时空实体子图的时空子图嵌入向量在向量空间中的相对位置关系,依据相对位置关系查询得到查询结果;与现有的知识图谱时空知识索引方法相比,利用基于图神经网络的顺序嵌入方法灵活挖掘图数据的结构特征,利用知识图谱本体索引知识图谱中的语义特征,利用3DR树组织并索引时空节点并将子图信息关联到3DR树节点上,解决了现有方法特征选定片面,且图结构特征利用较低的问题;通过在图数据库中构建3DR索引树,利用图数据库的图算法进行遍历,避免了将索引文件导入内存的过程,在减小时空知识图谱索引消耗的存储空间的同时大幅提升具有语义条件的时空交集查询效率。
本发明的其它有益效果将在随后的具体实施方式部分予以详细说明。
附图说明
图1为本发明实施例的流程示意图;
图2为本发明实施例中3DR索引树的模型示意图;
图3为本发明实施例中查询子图的示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是锁定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本发明针对现有的问题,提供了一种时空知识图谱索引方法及相关设备。
如图1-3所示,本发明的实施例提供了一种时空知识图谱索引方法,包括:
步骤1,获取图数据库的时空知识图谱中所有时空节点的时空属性数据,基于时空属性数据将每个时空节点与3DR索引树的节点进行连接,构建3DR索引树,每个时空节点中包含有多个时空实体;
具体来说,步骤1包括:
获取Nebula Graph图数据库中行人与兴趣点(Point of Interest,POI)间交互关系的时空知识图谱,并获取该时空知识图谱中所有时空节点的时空属性数据,时空属性数据包括时空坐标、时间信息和最小包络矩形,基于时空属性数据获取每个时空节点的时空坐标,每个时空节点中包含有多个时空实体;
基于时空属性数据将每个时空节点与3DR索引树的节点进行连接,将每个时空节点中的时空实体插入3DR索引树的节点;
3DR索引树的根节点为<L,LU,RB,N>,其中L为节点层级,根节点设置为0,LU、RB表示3DR索引树的节点对应的时空范围,N表示时空节点内包含的时空实体数量。
3DR索引树是原始R-Tree的简单扩展,将时间视为另一个维度。3DR索引树在范围查询上有着较好的性能,区域重叠越小,查询性能就越好。
NebulaGraph图数据库是一款开源的、分布式的、易扩展的原生图数据库,它采用shared-nothing架构,支持在不停止数据库服务的情况下扩缩容,能够承载数千亿个点和数万亿条边的超大规模数据集;由负责处理查询请求的Graph服务、负责数据管理的Meta服务和负责存储数据的Storage服务三种服务构成,是一种存储与计算分离的架构。
具体来说,将每个时空节点中的时空实体插入3DR索引树的节点,包括:
从3DR索引树的根节点开始插入时空实体,依据贪婪策略,在3DR索引树的每一层插入时空实体后,依次选择最小包络矩形体积最小的叶子节点以及最包络矩形长宽高之和最小的叶子节点;
当待插入的叶子节点内存放的时空实体数量达到阈值时,将叶子节点中离最小包络矩形的中心点最远的时空实体删除,重新插入3DR索引树的节点中;
若重新插入3DR索引树的节点中时空实体数量大于阈值时,则对该节点进行划分,并通过3DR索引树的关系边将划分好的节点连接至与节点对应的3DR索引树的节点上。
在本发明实施例中,如果在重新插入3DR索引树的节点后依然存在时空实体数量大于阈值,即存在时空实体溢出情况,则需要对存在溢出情况的节点进行划分,选择重叠长度最长的坐标轴为划分轴进行划分,之后根据选定的坐标轴对存在溢出情况的节点中的时空实体进行排序,考虑每个可能的节点重叠情况,使得最终生成的两个新节点之间的重叠部分最小,新生成的3DR索引树的两个节点通过3DR索引树的从属关系边连接到父节点(即存在溢出情况的节点)上,3DR索引树的层数由超参数LN控制。
将处理完成的3DR索引树扩展知识图谱使用nebula-spark-connector等spark插件批量存入图数据库中。
步骤2,针对3DR索引树中的每个节点,将节点内部包含的所有时空实体进行聚合,得到超图节点,并将超图节点的二阶子图作为训练数据;
本发明实施例利用spark框架对图数据库的时空知识图谱中的三元组进行高效率的逐层抽样,使用上述步骤得到3DR索引树扩展知识图谱在图神经网络模型中进行迭代,并对3DR索引树中所有的叶子节点分别进行不同数量的采样,采样数量与3DR索引树中各节点内包含的时空实体数量正相关,采样比例采用超参数V控制,对于每个时空节点的二阶子图,在该二阶子图中的每一阶中随机采样[1,min<4,maxNeighNum>]个节点作为训练子图的节点,其中,maxNeighNum代表该节点的最大邻居数量,完成叶子节点的子图采样,得到时间子图和空间子图。
对3DR索引树中的每个节点,采用深度优先的方式遍历至其叶子节点,读取叶子节点连接的时空节点中包含的时空实体数量。
使用轮盘赌算法获取在V比例下采集的时空节点,获取该时空节点的二阶子图,并将所有的时空节点聚合为超图节点,该超图节点不包含任何属性。
步骤3,将训练数据输入图神经网络模型进行训练,得到子图匹配模型并存入索引文件中,子图匹配模型用于比对查询子图与每个叶子节点下的时空实体子图的嵌入向量在向量空间的相对位置关系;
具体来说,步骤3包括:
通过更改训练数据中各节点内部的属性信息和替换关系类型两种方式生成负样本;
将负样本和训练数据输入图神经网络模型进行训练,利用GraphSage向量聚合思想将在3DR索引树的节点内采样得到的子图嵌入向量进行聚合,得到聚合向量;
将聚合向量赋给3DR索引树的所有节点,并自底向上依次将每层节点的聚合向量进行聚合,得到3DR索引树中各节点的子图信息向量表征并存入索引文件中;
图神经网络模型采用多任务学习方法分别学习子图判别任务和图相似性判别任务,并采用均方误差损失函数对图神经网络模型进行训练,得到子图匹配模型并存入索引文件中。
具体来说,本发明实施例替换关系类型操作包括对原有关系边的删除及新关系边的添加等操作;之后使用图神经网络模型对训练数据和负样本进行嵌入,利用GraphSage向量聚合思想将在3DR索引树的节点内采样得到的子图嵌入向量通过池化聚合函数进行聚合,并将得到的聚合向量赋给3DR索引树的每个节点,并将3DR索引树中每层节点自底向上依次聚合,获取3DR索引树中各节点的子图信息向量表征并存入索引文件中。
模型训练采用多任务学习方法,分别学习子图判别、图相似性判别任务,其中,子图判别任务的目标函数选取为最大距离函数,即设A为B的子图,则B的子图嵌入向量VB各维度应均大于A的子图嵌入向量VA各维度,P为从图数据库中抽样得到的子图嵌入向量的集合,损失函数满足公式:
图相似性判别任务共享子图判别任务的部分参数、本体语义及结构;越相似的子图,其在向量空间中的位置越接近,其中本体语义相似度定义为子图在本体中的距离,即在本体3DR索引树中搜索两个子图之间的最小距离,将该距离归一化处理后作为本体语义距离。
在图神经网络模型GCN的基础上计算两个子图之间所有可能的节点嵌入对之间的内积,从不同的GCN层得到多个相似矩阵s。
本发明实施例利用多个独立的CNN处理不同尺度下的相似矩阵,将图的相似度度量任务转化为图像处理问题,CNN的最大池化层选择最优匹配模式,将CNN的结果连接并反馈到多个全连接层中,得到计算子图的相似度分数,同时采用均方误差损失函数对模型进行训练,得到子图匹配模型;每次训练迭代都需按照上步中所述步骤对时空实体节点进行重新采样。
训练完成后,将图相似性模型参数提取存储至3DR索引树中各节点的模型参数属性字段中;将子图匹配模型的参数存为文本文件;将各3DR索引树中各节点对应的子图嵌入向量存储在节点的向量表征字段中。特别地,所用的索引模型均为固定的,预先编写并存储在服务器中,索引的存储数据仅为图相似性判别模型参数信息、子图表征向量信息以及单独存储的嵌入模型参数信息。
步骤4,将获取的查询请求进行分解,得到查询子图和时空约束,将查询子图和时空约束输入子图匹配模型进行计算,得到查询子图的嵌入向量以及时空范围参数,时空范围参数包括时空约束下的最小时空坐标和最大时空坐标;
具体来说,在本发明实施例中查询请求为“在长沙市内寻找过去10分钟内长沙商场周围5km范围内存在时空交集的人所逗留的地点”,根据查询请求中的图结构信息,将获取的查询请求分解为查询子图和时空约束,查询子图由行人、地区分别与POI交互关系连接而成,将行人作为时空节点,时空约束包括时间区间和空间约束,时间区间为[当前时间-10min,当前时间],空间约束为distance(商场、行人)<5km。
读取子图匹配模型的参数文本文件,对以时空节点为锚点跳数超过2的时空子图,截取2跳关系以内的时空子图进行嵌入计算,超过2跳的时空子图部分取新锚点,在本发明实施例中,将查询子图直接输入子图匹配模型,通过模型参数计算出查询子图的嵌入向量,并生成查询子图的图结构信息。
对查询请求中的时空约束部分,从图数据库中获取长沙市内各商场所在坐标,根据各商场所在坐标计算时空约束下的最小时空坐标(x,y,t)及最大时空坐标(X,Y,T)作为时空范围参数用于时空查询。
步骤5,通过3DR索引树对所有时空节点中的时空属性数据进行剪枝,在3DR索引树中查找与每个叶子节点对应的时空节点下的时空实体子图,并根据查询子图和子图匹配模型对每个叶子节点下的时空实体子图进行剪枝,得到每个叶子节点下的时空实体子图的时空子图嵌入向量;
具体来说,通过3DR索引树对所有时空节点中的时空属性数据进行剪枝,在3DR索引树中查找与每个叶子节点对应的时空节点下的时空实体子图,包括:
从3DR索引树的根节点开始,设(x,y,z)为查询节点的最小包络矩形的三维坐标,设(X,Y,Z)为3DR索引树中节点的空间范围矩形的三维坐标;
通过3DR索引树对所有时空节点中的时空属性数据进行剪枝;
当且仅当min(x)>min(X)、min(y)>min(Y)、min(z)>min(Z)、max(x)<max(X)、max(y)<max(Y)、max(z)<max(Z)时,在3DR索引树中递归查找到与每个叶子节点对应的时空节点下的时空实体子图。
步骤6,对比查询子图的嵌入向量与每个叶子节点下的时空实体子图的时空子图嵌入向量在向量空间中的相对位置关系,依据相对位置关系查询得到查询结果。
具体来说,步骤6包括:
对比查询子图与每个叶子节点下的时空实体子图的使用子图嵌入向量在向量空间中的相对位置关系,通过相对位置关系判断查询子图是否在时空范围内;
当查询子图在时空范围内,且查询子图的嵌入向量在向量空间中满足各维度坐标值小于3DR索引树各节点的子图嵌入向量的各维度坐标值,则对3DR索引树中各节点重复进行剪枝,直到递归到叶子节点,并在图数据库的时空知识图谱中对与叶子节点相关联的时空节点下的所有时空实体进行重复查询,得到以时空实体为锚点的目标子图;
基于目标子图,获取得到同时满足子图关系和时空位置关系的时空节点列表并输入时空节点ID,并基于时空节点ID将时空约束进行转化,得到时空节点ID约束;
依据时空节点ID约束以及待查询的时空知识请求重写查询语句并输入图数据库的时空知识图谱中进行查询,得到查询结果;
当查询子图不在时空范围内,则将查询子图的嵌入向量与每个叶子节点下的时空实体子图的时空子图嵌入向量输入图相似性判别模型进行计算,得到近似查询结果。
在本发明实施例中,通过子图匹配模型查询得到查询结果为行人的编号以及编号列表id_list,获取查询需求中的逗留区域部分,将查询请求“在长沙市内寻找过去10分钟内长沙商场周围5km范围内存在时空交集的人所逗留的地点”重写为“MATCH(v)-[e:visit]->(p:POI) WHERE id(v) in [id_list] RETURN v,p”,将重写后的查询请求输入Nebula Graph数据库中,查询得到满足查询条件的行人和逗留的POI地点信息。
本发明实施例通过获取图数据库的时空知识图谱中所有时空节点的时空属性数据,基于时空属性数据将每个时空节点与3DR索引树的节点进行连接,构建3DR索引树;针对3DR索引树中的每个节点,将节点内部包含的所有时空实体进行聚合,得到超图节点,并将超图节点的二阶子图作为训练数据;将训练数据输入图神经网络模型进行训练,得到子图匹配模型并存入索引文件中;将获取的查询请求进行分解,得到查询子图和时空约束,将查询子图和时空约束输入子图匹配模型进行计算,得到查询子图的嵌入向量以及时空范围参数;通过3DR索引树对所有时空节点中的时空属性数据进行剪枝,在3DR索引树中查找与每个叶子节点对应的时空节点下的时空实体子图,并根据查询子图和子图匹配模型对每个叶子节点下的时空实体子图进行剪枝,得到每个叶子节点下的时空实体子图的时空子图嵌入向量;对比查询子图的嵌入向量与每个叶子节点下的时空实体子图的时空子图嵌入向量在向量空间中的相对位置关系,依据相对位置关系查询得到查询结果;与现有的知识图谱时空知识索引方法相比,利用基于图神经网络的顺序嵌入方法灵活挖掘图数据的结构特征,利用知识图谱本体索引知识图谱中的语义特征,利用3DR树组织并索引时空节点并将子图信息关联到3DR树节点上,解决了现有方法特征选定片面,且图结构特征利用较低的问题;通过在图数据库中构建3DR索引树,利用图数据库的图算法进行遍历,避免了将索引文件导入内存的过程,在减小时空知识图谱索引消耗的存储空间的同时大幅提升具有语义条件的时空交集查询效率。
本发明实施例还提供了一种时空知识图谱索引装置,包括:
构建模块,用于获取图数据库的时空知识图谱中所有时空节点的时空属性数据,基于时空属性数据将每个时空节点与3DR索引树的节点进行连接,构建3DR索引树,每个时空节点中包含有多个时空实体;
聚合模块,用于针对3DR索引树中的每个节点,将节点内部包含的所有时空实体进行聚合,得到超图节点,并将超图节点的二阶子图作为训练数据;
训练模块,用于将训练数据输入图神经网络模型进行训练,得到子图匹配模型并存入索引文件中,子图匹配模型用于比对查询子图与每个叶子节点下的时空实体子图的嵌入向量在向量空间的相对位置关系;
计算模块,用于将获取的查询请求进行分解,得到查询子图和时空约束,将查询子图和时空约束输入子图匹配模型进行计算,得到查询子图的嵌入向量以及时空范围参数,时空范围参数包括时空约束下的最小时空坐标和最大时空坐标;
剪枝模块,用于通过3DR索引树对所有时空节点中的时空属性数据进行剪枝,在3DR索引树中查找与每个叶子节点对应的时空节点下的时空实体子图,并根据查询子图和子图匹配模型对每个叶子节点下的时空实体子图进行剪枝,得到每个叶子节点下的时空实体子图的时空子图嵌入向量;
查询模块,用于对比查询子图的嵌入向量与每个叶子节点下的时空实体子图的时空子图嵌入向量在向量空间中的相对位置关系,依据相对位置关系查询得到查询结果。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本发明实施例的方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当该计算机程序被处理器执行时,实现时空知识图谱索引方法。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到构建装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROm,Read-Only memory)、随机存取存储器(RAm,RandomAccess memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本发明实施例还提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现时空知识图谱索引方法。
需要说明的是,终端设备可以是手机、平板电脑、笔记本电脑、超级移动个人计算机(UmPC,Ultra-mobile Personal Computer)、上网本、个人数字助理(PDA,PersonalDigital Assistant)等终端设备上,例如,终端设备可以是WLAN中的站点(ST,STAiON),可以是蜂窝电话、无绳电话、会话启动协议(SiP,Session initiation Protocol)电话、无线本地环路(WLL,Wireless Local Loop)站、个人数字处理(PDA,Personal DigitalAssistant)设备、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、电脑、膝上型计算机、手持式通信设备、手持式计算设备、卫星无线设备等。本发明实施例对终端设备的具体类型不作任何限制。
所称处理器可以是中央处理单元(CPU,Central Processing Unit),该处理器还可以是其他通用处理器、数字信号处理器(DSP,Digital Signal Processor)、专用集成电路(ASiC,Application Specific integrated Circuit)、现成可编程门阵列(FPGA,Field-Programmable Gate Array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器在一些实施例中可以是所述终端设备的内部存储单元,例如终端设备的硬盘或内存。所述存储器在另一些实施例中也可以是所述终端设备的外部存储设备,例如所述终端设备上配备的插接式硬盘,智能存储卡(SmC,Smart media Card),安全数字(SD,Secure Digital)卡,闪存卡(Flash Card)等。进一步地,所述存储器还可以既包括所述终端设备的内部存储单元也包括外部存储设备。所述存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本发明实施例方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (9)
1.一种时空知识图谱索引方法,其特征在于,包括:
步骤1,获取图数据库的时空知识图谱中所有时空节点的时空属性数据,基于所述时空属性数据将每个所述时空节点与3DR索引树的节点进行连接,构建3DR索引树,每个所述时空节点中包含有多个时空实体;
步骤2,针对所述3DR索引树中的每个节点,将所述节点内部包含的所有时空实体进行聚合,得到超图节点,并将所述超图节点的二阶子图作为训练数据;
步骤3,将所述训练数据输入图神经网络模型进行训练,得到子图匹配模型并存入索引文件中,所述子图匹配模型用于比对查询子图与每个叶子节点下的时空实体子图的嵌入向量在向量空间的相对位置关系;
步骤4,将获取的查询请求进行分解,得到查询子图和时空约束,将所述查询子图和所述时空约束输入所述子图匹配模型进行计算,得到所述查询子图的嵌入向量以及时空范围参数,所述时空范围参数包括所述时空约束下的最小时空坐标和最大时空坐标;
步骤5,通过所述3DR索引树对所有时空节点中的时空属性数据进行剪枝,在所述3DR索引树中查找与每个所述叶子节点对应的时空节点中的时空实体子图,并根据所述查询子图和所述子图匹配模型对每个所述叶子节点下的时空实体子图进行剪枝,得到每个所述叶子节点下的时空实体子图的时空子图嵌入向量;
步骤6,对比所述查询子图的嵌入向量与每个所述叶子节点下的时空实体子图的时空子图嵌入向量在向量空间中的相对位置关系,依据所述相对位置关系查询得到查询结果。
2.根据权利要求1所述的时空知识图谱索引方法,其特征在于,所述步骤1包括:
获取图数据库的时空知识图谱中所有时空节点的时空属性数据,所述时空属性数据包括时空坐标、时间信息和最小包络矩形,基于时空属性数据获取每个所述时空节点的时空坐标,每个所述时空节点中包含有多个时空实体;
基于所述时空属性数据将每个所述时空节点与3DR索引树的节点进行连接,将每个所述时空节点中的时空实体插入所述3DR索引树的节点;
所述3DR索引树的根节点为<L,LU,RB,N>,其中L为节点层级,根节点设置为0,LU、RB表示3DR索引树的节点对应的时空范围,N表示时空节点内包含的时空实体数量。
3.根据权利要求2所述的时空知识图谱索引方法,其特征在于,将每个所述时空节点中的时空实体插入所述3DR索引树的节点,包括:
从所述3DR索引树的根节点开始插入所述时空实体,依据贪婪策略,在所述3DR索引树的每一层插入所述时空实体后,依次选择所述最小包络矩形体积最小的叶子节点以及最包络矩形长宽高之和最小的叶子节点;
当待插入的叶子节点内存放的时空实体数量达到阈值时,将所述叶子节点中离最小包络矩形的中心点最远的时空实体删除,重新插入所述3DR索引树的节点中;
若重新插入所述3DR索引树的节点中时空实体数量大于阈值时,则对该节点进行划分,并通过所述3DR索引树的关系边将划分好的节点连接至与所述节点对应的3DR索引树的节点上。
4.根据权利要求3所述的时空知识图谱索引方法,其特征在于,所述步骤3包括:
通过更改所述训练数据中各节点内部的属性信息和替换关系类型两种方式生成负样本;
将所述负样本和所述训练数据输入所述图神经网络模型进行训练,利用GraphSage向量聚合思想将在3DR索引树的节点内采样得到的子图嵌入向量进行聚合,得到聚合向量;
将所述聚合向量赋给所述3DR索引树的所有节点,并自底向上依次将每层节点的聚合向量进行聚合,得到所述3DR索引树中各节点的子图信息向量表征并存入索引文件中;
所述图神经网络模型采用多任务学习方法分别学习子图判别任务和图相似性判别任务,并采用均方误差损失函数对所述图神经网络模型进行训练,得到子图匹配模型并存入索引文件中。
5.根据权利要求4所述的时空知识图谱索引方法,其特征在于,所述通过所述3DR索引树对所有时空节点中的时空属性数据进行剪枝,在所述3DR索引树中查找与每个所述叶子节点对应的时空节点中的时空实体子图,包括:
从所述3DR索引树的根节点开始,设(x,y,z)为查询节点的最小包络矩形的三维坐标,设(X,Y,Z)为所述3DR索引树中节点的空间范围矩形的三维坐标;
通过所述3DR索引树对所有时空节点中的时空属性数据进行剪枝;
当且仅当min(x)>min(X)、min(y)>min(Y)、min(z)>min(Z)、max(x)<max(X)、max(y)<max(Y)、max(z)<max(Z)时,在所述3DR索引树中递归查找到与每个所述叶子节点对应的时空节点下的时空实体子图。
6.根据权利要求5所述的时空知识图谱索引方法,其特征在于,所述步骤6包括:
对比所述查询子图与每个所述叶子节点下的时空实体子图的时空子图嵌入向量在向量空间中的相对位置关系,通过所述相对位置关系判断所述查询子图是否在所述时空范围内;
当所述查询子图在时空范围内,且所述查询子图的嵌入向量在向量空间中满足各维度坐标值小于所述3DR索引树各节点的子图嵌入向量的各维度坐标值,则对所述3DR索引树中各节点重复进行剪枝,直到递归到叶子节点,并在所述图数据库的时空知识图谱中对与所述叶子节点相关联的所有时空节点进行重复查询,得到以时空实体为锚点的目标子图;
基于所述目标子图,获取得到同时满足子图关系和时空位置关系的时空节点列表并输入时空节点ID,并基于所述时空节点ID将所述时空约束进行转化,得到时空节点ID约束;
依据所述时空节点ID约束以及查询请求重写查询请求并输入图数据库的时空知识图谱中进行查询,得到查询结果;
当所述查询子图不在时空范围内,则将所述查询子图的嵌入向量与每个所述叶子节点下的时空实体子图的时空子图嵌入向量输入图相似性判别模型进行计算,得到近似查询结果。
7.一种时空知识图谱索引装置,其特征在于,包括:
构建模块,用于获取图数据库的时空知识图谱中所有时空节点的时空属性数据,基于所述时空属性数据将每个所述时空节点与3DR索引树的节点进行连接,构建3DR索引树,每个所述时空节点中包含有多个时空实体;
聚合模块,用于针对所述3DR索引树中的每个节点,将所述节点内部包含的所有时空实体进行聚合,得到超图节点,并将所述超图节点的二阶子图作为训练数据;
训练模块,用于将所述训练数据输入图神经网络模型进行训练,得到子图匹配模型并存入索引文件中,所述子图匹配模型用于比对查询子图与每个叶子节点下的时空实体子图的嵌入向量在向量空间的相对位置关系;
计算模块,用于将获取的查询请求进行分解,得到查询子图和时空约束,将所述查询子图和所述时空约束输入所述子图匹配模型进行计算,得到所述查询子图的嵌入向量以及时空范围参数,所述时空范围参数包括所述时空约束下的最小时空坐标和最大时空坐标;
剪枝模块,用于通过所述3DR索引树对所有时空节点中的时空属性数据进行剪枝,在所述3DR索引树中查找与每个所述叶子节点对应的时空节点下的时空实体子图,并根据所述查询子图和所述子图匹配模型对每个所述叶子节点下的时空实体子图进行剪枝,得到每个所述叶子节点下的时空实体子图的时空子图嵌入向量;
查询模块,用于对比所述查询子图的嵌入向量与每个所述叶子节点下的时空实体子图的时空子图嵌入向量在向量空间中的相对位置关系,依据所述相对位置关系查询得到查询结果。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,当该计算机程序被处理器执行时,实现如权利要求1至6任一项所述的时空知识图谱索引方法。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的时空知识图谱索引方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311299795.6A CN117033541B (zh) | 2023-10-09 | 2023-10-09 | 一种时空知识图谱索引方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311299795.6A CN117033541B (zh) | 2023-10-09 | 2023-10-09 | 一种时空知识图谱索引方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117033541A true CN117033541A (zh) | 2023-11-10 |
CN117033541B CN117033541B (zh) | 2023-12-19 |
Family
ID=88641676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311299795.6A Active CN117033541B (zh) | 2023-10-09 | 2023-10-09 | 一种时空知识图谱索引方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117033541B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100650389B1 (ko) * | 2005-11-10 | 2006-11-29 | 성균관대학교산학협력단 | 2차원 구조의 시분할 이동 객체 인덱싱 시스템 및 방법 |
CN104750708A (zh) * | 2013-12-27 | 2015-07-01 | 华为技术有限公司 | 一种时空数据的索引建立方法、查询方法、装置及设备 |
US20150254276A1 (en) * | 2014-03-06 | 2015-09-10 | International Business Machines Corporation | Indexing geographic data |
CN109885692A (zh) * | 2019-01-11 | 2019-06-14 | 平安科技(深圳)有限公司 | 知识数据存储方法、装置、计算机设备和存储介质 |
US20200012733A1 (en) * | 2018-07-06 | 2020-01-09 | International Business Machines Corporation | Multi-dimensional knowledge index and application thereof |
WO2020143184A1 (zh) * | 2019-01-11 | 2020-07-16 | 平安科技(深圳)有限公司 | 知识融合方法、装置、计算机设备和存储介质 |
US20210397617A1 (en) * | 2020-06-19 | 2021-12-23 | Robert Bosch Gmbh | Computer-implemented method for keyword search in a knowledge graph |
CN114896472A (zh) * | 2022-05-27 | 2022-08-12 | 中国科学院空天信息创新研究院 | 一种基于多源时空数据的知识图谱机器推理系统和方法 |
CN116244450A (zh) * | 2023-03-29 | 2023-06-09 | 北斗伏羲中科数码合肥有限公司 | 时空认知图谱生成方法 |
-
2023
- 2023-10-09 CN CN202311299795.6A patent/CN117033541B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100650389B1 (ko) * | 2005-11-10 | 2006-11-29 | 성균관대학교산학협력단 | 2차원 구조의 시분할 이동 객체 인덱싱 시스템 및 방법 |
CN104750708A (zh) * | 2013-12-27 | 2015-07-01 | 华为技术有限公司 | 一种时空数据的索引建立方法、查询方法、装置及设备 |
US20150254276A1 (en) * | 2014-03-06 | 2015-09-10 | International Business Machines Corporation | Indexing geographic data |
US20200012733A1 (en) * | 2018-07-06 | 2020-01-09 | International Business Machines Corporation | Multi-dimensional knowledge index and application thereof |
CN109885692A (zh) * | 2019-01-11 | 2019-06-14 | 平安科技(深圳)有限公司 | 知识数据存储方法、装置、计算机设备和存储介质 |
WO2020143184A1 (zh) * | 2019-01-11 | 2020-07-16 | 平安科技(深圳)有限公司 | 知识融合方法、装置、计算机设备和存储介质 |
US20210397617A1 (en) * | 2020-06-19 | 2021-12-23 | Robert Bosch Gmbh | Computer-implemented method for keyword search in a knowledge graph |
CN114896472A (zh) * | 2022-05-27 | 2022-08-12 | 中国科学院空天信息创新研究院 | 一种基于多源时空数据的知识图谱机器推理系统和方法 |
CN116244450A (zh) * | 2023-03-29 | 2023-06-09 | 北斗伏羲中科数码合肥有限公司 | 时空认知图谱生成方法 |
Non-Patent Citations (5)
Title |
---|
MAHDI ABDELGUERFI等: "The 2-3TR-tree, a trajectory-oriented index structure for fully evolving valid-time spatio-temporal datasets", GIS\'02:PROCEEDINGS OF THE 10TH ACM INTERNATIONAL SYMPOSIUM ON ADVANCES INGEOGRAPHIC INFORMATION SYSTEMS, pages 29 - 34 * |
MIN DENG等: "Mining spatiotemporal association patterns from complex geographic phenomena", INTERNATIONAL JOURNAL OF GEOGRAPHICAL INFORMATION SCIENCE, vol. 34, no. 6, pages 1162 - 1187 * |
ZHI TONG ZHANG: "3DR-Tree Model Improvement Based on Enhance of index Performance", ADVANCED MATERIALS RESEARCH(VOLUMES 765-767), pages 1332 - 1335 * |
刘耀林等: "地理大数据挖掘研究进展与挑战", 测绘学报, vol. 51, no. 7, pages 1544 - 1560 * |
徐少文;刘新华;: "一种在移动GIS环境下基于R树的并行窗口查询系统模型", 九江学院学报, no. 06 * |
Also Published As
Publication number | Publication date |
---|---|
CN117033541B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11720606B1 (en) | Automated geospatial data analysis | |
Kanungo et al. | An efficient k-means clustering algorithm: Analysis and implementation | |
US20070239694A1 (en) | Graph querying, graph motif mining and the discovery of clusters | |
CN111966793B (zh) | 基于知识图谱的智慧问答方法、系统和知识图谱更新系统 | |
Wang et al. | Duplicate discovery on 2 billion internet images | |
Cao et al. | Analyzing the composition of cities using spatial clustering | |
Lei | Geospatial data conflation: A formal approach based on optimization and relational databases | |
CN108182230B (zh) | 基于位向量四叉树的移动对象汇聚模式挖掘方法 | |
CN117033541B (zh) | 一种时空知识图谱索引方法及相关设备 | |
CN110706740B (zh) | 基于模块分解的蛋白质功能预测的方法、装置、设备 | |
CN111309946A (zh) | 一种已建立档案优化方法及装置 | |
CN116304213A (zh) | 基于图神经网络的rdf图数据库子图匹配查询优化方法 | |
Zhu et al. | SVS-JOIN: efficient spatial visual similarity join for geo-multimedia | |
Debnath et al. | A novel approach to trajectory analysis using string matching and clustering | |
Vieira et al. | Spatio-temporal databases: Complex motion pattern queries | |
Sanjuan-Contreras et al. | cBiK: a space-efficient data structure for spatial keyword queries | |
Liu et al. | Digraph clustering by the BlueRed method | |
CN113761243A (zh) | 在线检索方法和系统 | |
Lin | Efficient and compact indexing structure for processing of spatial queries in line-based databases | |
Ji et al. | Vocabulary tree incremental indexing for scalable location recognition | |
Zhang et al. | Distributed top-k similarity query on big trajectory streams | |
Wu et al. | STKST-I: An Efficient Semantic Trajectory Search by Temporal and Semantic Keywords | |
CN112508628B (zh) | 一种基于意图树的需求模式挖掘方法 | |
CN115086179B (zh) | 一种社交网络中社区结构的检测方法 | |
CN110096529B (zh) | 一种基于多维矢量数据的网络数据挖掘方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |