CN117633033A - 基于知识图谱的地理空间信息查询方法、系统、设备及介质 - Google Patents
基于知识图谱的地理空间信息查询方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN117633033A CN117633033A CN202311550744.6A CN202311550744A CN117633033A CN 117633033 A CN117633033 A CN 117633033A CN 202311550744 A CN202311550744 A CN 202311550744A CN 117633033 A CN117633033 A CN 117633033A
- Authority
- CN
- China
- Prior art keywords
- geographic
- query
- information
- entity
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000011218 segmentation Effects 0.000 claims abstract description 8
- 238000000605 extraction Methods 0.000 claims description 18
- 238000005516 engineering process Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 11
- 238000003058 natural language processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000005065 mining Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000013138 pruning Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 238000012732 spatial analysis Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于知识图谱的地理空间信息查询方法、系统、设备及介质,属于地理知识查询检索技术领域,本发明要解决的技术问题为传统地理信息查询方式难以使用,查询方式粗犷,查询结果单一,不能形象展示查询结果与查询条件之间的信息关联关系,采用的技术方案为:构建地理知识图谱:基于地图、影像、地形、属性以及元数据的基础地理信息数据以及网络百科全书数据构建地理知识图谱;提示用户输入查询信息:接收用户问句,并提取用户问句包含的意图和实体;构建查询算子:对用户输入的自然语言进行分词,提取查询标签及查询关系构建查询算子;查找地理空间信息;展示查询结果。
Description
技术领域
本发明涉及地理知识查询检索技术领域,具体地说是一种基于知识图谱的地理空间信息查询方法、系统、设备及介质。
背景技术
知识图谱是一种以结构化的形式描述客观世界中概念、实体及其关系的方式,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱给互联网语义搜索带来了活力,同时也在智能问答中显示出强大威力,已经成为互联网知识驱动的智能应用的基础设施。
针对时空数据和文本关键词的查询,目前已经取得了较好的进展,如IR-Tree,BRTree等;它们的主要思想都是在空间索引中维护其他额外的关键信息(如文本关键词信息等),以此在基于空间索引的空间剪枝的能力的基础上,增加额外的剪枝能力(如文本剪枝能力),最终有效地提高查询的效率;但是,正是由于在空间索引中维护了额外的信息,所以为了维护这些额外的信息而导致的空间上的开销,也是需要考虑和权衡的。除此之外,由于在知识图谱中数据是以节点(图数据)的形式存在,其时空信息和文件关键词信息是以节点的属性或独立的节点的形式存在,所以对于如何厘清不同粒度的空间实体和文本等非空间实体的逻辑关联关系、如何有效地利用地理关联技术去关联知识图谱中实体的语义信息和空间信息、如何有效地将时空数据和文本关键词的查询相关的高效算法应用于知识图谱中等等难点,仍具有一定的思考和研究的空间。
现有的地理信息系统在地理知识查询方面只提供了单一的搜索文本框,用户在使用时由于对搜索目标点模糊而不能快速确定最终的查询内容。当前的地理信息查询方式通常需要用户手动输入查询条件,如地理位置、地名等,这增加了查询时间和难度。由于地理信息的复杂性和动态性,查询结果可能不准确或者不全面,不能满足用户的需求。许多地理信息查询需要考虑到空间关系,如距离、方位、高度等,当前的查询方式无法很好地支持这些空间关系查询。当前的查询方式通常基于关键词搜索,无法很好地支持语义查询,即根据用户的需求,查询结果需要更加精准地匹配用户的需求。对于一些需要可视化结果的地理信息查询,当前的查询方式可视化效果不佳,无法直观地展示查询结果。
发明内容
本发明的技术任务是提供一种基于知识图谱的地理空间信息查询方法、系统、设备及介质,来解决传统地理信息查询方式难以使用,查询方式粗犷,查询结果单一,不能形象展示查询结果与查询条件之间的信息关联关系的问题。
本发明的技术任务是按以下方式实现的,一种基于知识图谱的地理空间信息查询方法,该方法具体如下:
构建地理知识图谱:基于地图、影像、地形、属性以及元数据的基础地理信息数据以及网络百科全书数据构建地理知识图谱;
提示用户输入查询信息:接收用户问句,并提取用户问句包含的意图和实体;
构建查询算子:对用户输入的自然语言进行分词,提取查询标签及查询关系构建查询算子;
查找地理空间信息:根据查询算子从知识图谱数据中查找到相关地理空间信息,并返回查询结果;
展示查询结果:展示查询结果中地理对象、关联关系、属性及空间位置的信息。
作为优选,构建地理知识图谱具体如下:
设计地理知识图谱的存储结构、地理实体的存储结构和地理语料库的存储结构;
通过网络百科全书和地理数据库构建地理知识图谱的数据来源,提取网络百科全书和/或地理数据库的信息存储至地理实体结构;
从已融合的知识中提取空间关系;其中,空间关系包括拓扑关系及方向关系;如桥和河流之间的“横跨”关系,道路和公园之间的“穿过”关系等;
采用知识图谱存储工具将融合后的地理知识以图结构的方式存储。
更优地,设计地理知识图谱的存储结构、地理实体的存储结构和地理语料库的存储结构具体如下:
地理知识图谱的存储结构采用图结构存储,地理知识图谱的存储结构表示为:KG=(E,R,L);其中,E是一组实体;R是一组带标签的有向边;L是一组文字;一个完整的知识图谱KG是一个三元组,表示为其中E中的实体代表真实世界的实体,有向边R代表真实世界的实体关系和实体属性;
地理实体的存储结构表示为:E1=∑e;其中,E1表示地理实体之和;e表示一个地理实体;一个地理实体e被关系r修饰后才会具有更多的地理意义;其中,e∈E;r∈R;
地理语料库的存储结构表示为:地理语料库为C,地理实体n∈C,n被表示为一个三元组n=<i,l,T>;其中,i表示地理实体在语料库中的编号,是与其余地理实体的区分的关键依据;由于每个实体都具有经纬度,所以使用l属性记录地理实体的空间位置信息;T表示多个成对键值对的集合,T用于描述地理实体在现实空间中的意义。
更优地,通过网络百科全书和地理数据库构建地理知识图谱的数据来源,提取网络百科全书和/或地理数据库的信息存储至地理实体结构具体如下:
若网络百科全书和地理数据库的实体结构同时描述,但信息记录内容不完全一致,则认为地理数据库中的信息比较准确,采用地理数据库中的信息为准,对齐形成地理实体节点;
提取网络百科全书中的信息是通过实体名称打开百科全书条目后,提取信息框中的属性名称和值;对于提取的实体中存在的属性值,根据属性名称构建对象特性;
提取地理数据库的信息实体时,空间数据库包括一个表列表,每个表都包含若干行,即地理图形特征,实体名称和特性字段之间的对应关系用于形成对,用于描述关系;运用自然语言处理和文本挖掘技术,从文本及图像的非结构化数据中识别出与地理空间信息相关的实体,用三元组的形式表示,包括地理实体、属性和关系;
实体层的融合是不同数据中不同标识实体的语义理解,关联到同一实体上,实现对同名、多名和缩写的多种实体语义的消歧,例如:“C国”、“C国全称”等都是指同一个地理实体;具体为:先生成候选地理实体,通过地理实体指称项从地理知识库中选取候选地理实体;再对候选实体排序,通过标注训练数据集训练候选实体排序模型;模型预测地理节点n和候选地理实体e是否代表同一真实世界实体,并为预测提供置信度评分;最后,在节点n的分类候选对中选择具有最高置信度的地理实体建立正确身份链接。
作为优选,构建查询算子具体如下:
提取查询标签:查询标签用于描述查询主题或领域的关键词或短语;提取查询标签具体为:先对用户的查询请求进行文本处理,文本处理包括分词、去除停用词及词干提取;再使用关键词提取算法的文本挖掘技术从处理后的文本中提取出查询标签;
提取查询关系:查询关系用于表示地理空间信息之间的联系或关系;提取查询关系具体为:对地理知识图谱中的实体和概念进行分析,以确定实体和概念之间的语义关系;
使用依存句法分析及命名实体识别的自然语言处理技术从用户的查询请求中识别出与语义关系相关的关键词或短语;
利用与语义相关的关键词或短语构建查询关系。
作为优选,地理空间信息的查询条件构建时,结合地理知识图谱和自然语言处理技术,将用户的自然语言查询请求转换为图谱查询语言,从而实现对地理知识图谱的查询和检索;并利用地理知识图谱的结构特点,对图谱中的实体、概念以及关系进行分析和处理,从而得到符合条件的地理空间信息。
作为优选,展示查询结果具体如下:
获取查询结果所得的各个点数据信息和边数据信息;
将获取到的点数据信息填充到数据列表中;
以目标点为基础绘制地理知识图谱;
将知识图谱和数据列表双向绑定;
将数据列表中的每个条目绑定模态框与三维地理场景进行联动;
其中,地理知识图谱展示点数据信息及边数据信息,并按照点数据的属性和边数据的属性对地理知识图谱进行过滤和重构;初始的地理知识图谱展示所有的点数据信息和边数据信息,以最终得到的目标搜索点为中心,其余数据点平铺在场景上,相关点之间以直线相连表示两点之间存在关系;
数据列表展示点数据信息,并按照不同字段对数据进行过滤和排序;初始的空数据列表只显示表头,分别为ID、名字和类型三项,ID、名字和类型分别展示地理实体的ID编码,名字和数据类型;数据列表将分条目自上而下展示每一个点数据信息,搜索的目标点数据作为数据列表的第一项,其余点数据依次排开。
一种基于知识图谱的地理空间信息查询系统,该系统用于实现上述的基于知识图谱的地理空间信息查询方法;该系统包括:
地理知识图谱构建模块,用于构建地理信息知识库;
提取模块,用于接收用户问句,并提取该用户问句包含的意图和实体;
查询语句构建模块,用于根据用户问句匹配的查询模板,构建对应的查询语句;
查询模块,用于根据构建的查询语句,查询知识图谱数据,并返回查询结果;
展示模块,用于展示查询结果中地理对象、关联关系、属性及空间位置的信息。
一种电子设备,包括:存储器和至少一个处理器;
其中,所述存储器上存储有计算机程序;
所述至少一个处理器执行所述存储器存储的计算机程序,使得所述至少一个处理器执行如上述的基于知识图谱的地理空间信息查询方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序可被处理器执行以实现如上述的基于知识图谱的地理空间信息查询方法。
本发明的基于知识图谱的地理空间信息查询方法、系统、设备及介质具有以下优点:
(一)本发明兼顾知识的内在联系和空间信息展示,根据用户输入的查询条件,快速高效地向用户提供与查询内容相关的空间信息并在三维场景中联动表达展示;
(二)本发明通过利用图形操作界面可视化构建查询模板,用户问答时将查询模板自动转化为图查询语句,在知识图谱中进行数据查询;
(三)本发明通过利用地理知识图谱,可以快速地定位到所需地理信息的位置,提高了查询效率;
(四)本发明地理知识图谱中的实体和关系都是经过清洗和规范化的,因此可以提供更为准确的地理信息查询结果;
(五)本发明的地理知识图谱中包含了大量的背景信息,如地理实体的属性、相互关系等,可以提供更为丰富的查询结果;
(六)本发明的地理知识图谱支持多维度查询,可以同时查询多个地理实体、属性等信息,并且可以进行复杂的组合查询,提供更为灵活的查询方式;
(七)本发明利用地理知识图谱中的语义信息,可以实现更为准确的语义查询,提高查询的精度和广度;
(八)本发明的地理知识图谱可以以可视化的形式展示查询结果,可以更加直观地展示地理信息的位置、分布等情况,增强可视化效果;
本发明基于地理知识图谱的空间分析方法,可以对空间数据进行分析和挖掘,获得更为深入的分析结果,提高了空间分析能力。
附图说明
下面结合附图对本发明进一步说明。
附图1为基于知识图谱的地理空间信息查询方法的流程框图;
附图2为基于知识图谱的地理空间信息查询系统的流程框图;
附图3为基于知识图谱的地理空间信息查询系统工作过程的示意图;
附图4为与传统关系型地理空间知识库空间查询方法效率对比图。
具体实施方式
参照说明书附图和具体实施例对本发明的基于知识图谱的地理空间信息查询方法、系统、设备及介质作以下详细地说明。
实施例1:
如附图1所示,本实施例提供了一种基于知识图谱的地理空间信息查询方法,该方法具体如下:
S1、构建地理知识图谱:基于地图、影像、地形、属性以及元数据的基础地理信息数据以及网络百科全书数据构建地理知识图谱;
S2、提示用户输入查询信息:接收用户问句,并提取用户问句包含的意图和实体;
S3、构建查询算子:对用户输入的自然语言进行分词,提取查询标签及查询关系构建查询算子;
S4、查找地理空间信息:根据查询算子从知识图谱数据中查找到相关地理空间信息,并返回查询结果;
S5、展示查询结果:展示查询结果中地理对象、关联关系、属性及空间位置的信息。
本实施例步骤S1中的构建地理知识图谱具体如下:
S101、设计地理知识图谱的存储结构、地理实体的存储结构和地理语料库的存储结构:针对地图、影像、地形、属性以及元数据等基础地理信息数据以及网络百科数据进行模式层和数据层的构建。抽取地理实体对象、关联关系、属性信息、空间关联关系等;
S102、通过网络百科全书和地理数据库构建地理知识图谱的数据来源,提取网络百科全书和/或地理数据库的信息存储至地理实体结构;
S103、从已融合的知识中提取空间关系:对地理数据源数据中的实体进行实体对齐及属性融合;其中,空间关系包括拓扑关系及方向关系;如桥和河流之间的“横跨”关系,道路和公园之间的“穿过”关系等;
S104、采用知识图谱存储工具将融合后的地理知识以图结构的方式存储。
本实施例步骤S101中的设计地理知识图谱的存储结构、地理实体的存储结构和地理语料库的存储结构具体如下:
S10101、地理知识图谱的存储结构采用图结构存储,地理知识图谱的存储结构表示为:KG=(E,R,L);其中,E是一组实体;R是一组带标签的有向边;L是一组文字;一个完整的知识图谱KG是一个三元组,表示为其中E中的实体代表真实世界的实体,有向边R代表真实世界的实体关系和实体属性;
S10102、地地理实体的存储结构表示为:E1=∑e;其中,E1表示地理实体之和;e表示一个地理实体;一个地理实体e被关系r修饰后才会具有更多的地理意义;其中,e∈E;r∈R;
S10103、地理语料库的存储结构表示为:地理语料库为C,地理实体n∈C,n被表示为一个三元组n=<i,l,T>;其中,i表示地理实体在语料库中的编号,是与其余地理实体的区分的关键依据;由于每个实体都具有经纬度,所以使用l属性记录地理实体的空间位置信息;T表示多个成对键值对的集合,T用于描述地理实体在现实空间中的意义。
本实施例步骤S102中的通过网络百科全书和地理数据库构建地理知识图谱的数据来源,提取网络百科全书和/或地理数据库的信息存储至地理实体结构具体如下:
S10201、若网络百科全书和地理数据库的实体结构同时描述,但信息记录内容不完全一致,则认为地理数据库中的信息比较准确,采用地理数据库中的信息为准,对齐形成地理实体节点;
S10202、提取网络百科全书中的信息是通过实体名称打开百科全书条目后,提取信息框中的属性名称和值;对于提取的实体中存在的属性值,根据属性名称构建对象特性;
S10203、提取地理数据库的信息实体时,空间数据库包括一个表列表,每个表都包含若干行,即地理图形特征,实体名称和特性字段之间的对应关系用于形成对,用于描述关系;运用自然语言处理和文本挖掘技术,从文本及图像的非结构化数据中识别出与地理空间信息相关的实体,用三元组的形式表示,包括地理实体、属性和关系;
S10204、实体层的融合是不同数据中不同标识实体的语义理解,关联到同一实体上,实现对同名、多名和缩写的多种实体语义的消歧,例如:“C国”、“C国全称”等都是指同一个地理实体;具体为:先生成候选地理实体,通过地理实体指称项从地理知识库中选取候选地理实体;再对候选实体排序,通过标注训练数据集训练候选实体排序模型;模型预测地理节点n和候选地理实体e是否代表同一真实世界实体,并为预测提供置信度评分;最后,在节点n的分类候选对中选择具有最高置信度的地理实体建立正确身份链接。
本实施例步骤S3中的构建查询算子具体如下:
S301、提取查询标签:查询标签用于描述查询主题或领域的关键词或短语;提取查询标签具体为:先对用户的查询请求进行文本处理,文本处理包括分词、去除停用词及词干提取;再使用关键词提取算法的文本挖掘技术从处理后的文本中提取出查询标签;
S302、提取查询关系:查询关系用于表示地理空间信息之间的联系或关系;提取查询关系具体为:对地理知识图谱中的实体和概念进行分析,以确定实体和概念之间的语义关系;
S303、使用依存句法分析及命名实体识别的自然语言处理技术从用户的查询请求中识别出与语义关系相关的关键词或短语;
S304、利用与语义相关的关键词或短语构建查询关系。
例如,如果用户输入的查询请求是查找“B市的所有公园”,那么可以通过以下方法提取查询标签和查询关系:
查询标签提取:在这个查询请求中,可以提取出“B市”、“公园”两个关键词作为查询标签。
查询关系提取:在这个查询请求中,可以认为“B市”和“公园”之间存在“位于”的关系。因此,可以提取出一个查询关系,即“B市”位于“公园”。
本实施例步骤S4中的地理空间信息的查询条件构建时,结合地理知识图谱和自然语言处理技术,将用户的自然语言查询请求转换为图谱查询语言,从而实现对地理知识图谱的查询和检索;并利用地理知识图谱的结构特点,对图谱中的实体、概念以及关系进行分析和处理,从而得到符合条件的地理空间信息。例如,用户输入的查询请求是“查找B市的所有旅游景点”,那么可以通过对地理知识图谱中的实体进行分析和处理,找到与“旅游景点”相关的实体,并得到符合条件的地理空间信息。
本实施例步骤S5中的展示查询结果具体如下:
S501、获取查询结果所得的各个点数据信息和边数据信息;
S502、将获取到的点数据信息填充到数据列表中;
S503、以目标点为基础绘制地理知识图谱;
S504、将知识图谱和数据列表双向绑定;
S505、将数据列表中的每个条目绑定模态框与三维地理场景进行联动;
其中,地理知识图谱展示点数据信息及边数据信息,并按照点数据的属性和边数据的属性对地理知识图谱进行过滤和重构;初始的地理知识图谱展示所有的点数据信息和边数据信息,以最终得到的目标搜索点为中心,其余数据点平铺在场景上,相关点之间以直线相连表示两点之间存在关系;
数据列表展示点数据信息,并按照不同字段对数据进行过滤和排序;初始的空数据列表只显示表头,分别为ID、名字和类型三项,ID、名字和类型分别展示地理实体的ID编码,名字和数据类型;数据列表将分条目自上而下展示每一个点数据信息,搜索的目标点数据作为数据列表的第一项,其余点数据依次排开。
使用一些真实的脱敏后的数据对本发明提出的查询方法进行实验,以展示其效果。
实验数据集
时间效率测试中所使用的数据集均是基于地理信息服务业务脱敏后的真实的数据集,如下表所示:
表1实验数据集
A是一组包含餐馆、购物中心、酒店等建筑实体及相关属性和位置信息的数据集。
B是一组包含自然地理实体对象、图形、属性、空间关系等信息数据集。
实验所使用的知识图谱中的节点和各节点之间的关联关系均通过实验数据集生成。
在进行查询时,采用的是查询一定范围内与指定地理实体的节点之间存在路径的地理节点的个数,其中查询范围随机产生。对于所生成的知识图谱,产生三次不同的查询,最后实验结果的查询时间取三次查询所用时间的平均值。如附图4所示,观察实验结果可以发现,基于本实施例在可以表现出较好良好的查询效率。通过知识图谱的表达方式可以更好的展示查询标签和查询结果的关系。
实施例2:
如附图2所示,本实施例提供了一种基于知识图谱的地理空间信息查询系统,该系统用于实现上述的基于知识图谱的地理空间信息查询方法;该系统包括:
地理知识图谱构建模块,用于构建地理信息知识库;
提取模块,用于接收用户问句,并提取该用户问句包含的意图和实体;
查询语句构建模块,用于根据用户问句匹配的查询模板,构建对应的查询语句;
查询模块,用于根据构建的查询语句,查询知识图谱数据,并返回查询结果;
展示模块,用于展示查询结果中地理对象、关联关系、属性及空间位置的信息。
其中,展示模块是基于得到的点数据信息和边数据信息,构建地理知识图谱并填充数据列表。因此,本实施例还将知识图谱和数据列表绑定以获得知识图谱内各数据的具体属性,同时通过和三维地理场景的联动展示每个地理实体对象的具体方位及与相关对象的联系。
地理知识图谱构建模块的工作过程具体如下:
(1)针对地图、影像、地形、属性以及元数据等基础地理信息数据以及网络百科数据进行模式层和数据层的构建,并抽取地理实体对象、关联关系、属性信息、空间关联关系等;
(2)对地理数据源数据中的实体进行实体对齐及属性融合;
(3)采用地理信息数据库和知识图谱存储工具将融合后的地理知识以图结构的方式存储。
提取模块的工作过程具体如下:
(1)对用户输入的用于描述查询问题的自然语言进行分词处理;
(2)利用word2vec词向量模型对所述分词处理后的语料信息进行处理,得到所述语料信息的词向量空间,将所述词向量空间确定为所述语料信息的领域语义概念网络;
(3)根据获取的语料提取查询标签和查询关系,构造查询算子。
如附图3所示,该系统的工作过程具体如下:
(1)预先构建地理知识图谱;
(2)提示用户输入查询信息;
(3)根据查询信息构建查询算子;
(4)根据构建的查询算子,搜索查询获得点数据信息和边数据信息;
(5)根据获得点数据信息和边数据信息,构建地理关系图谱并填充数据列表;
(6)将数据列表与三维地理场景绑定,实现每个查询结果的详细说明及展示。
实施例3:
本实施例还提供了一种电子设备,包括:存储器和处理器;
其中,存储器存储计算机执行指令;
处理器执行所述存储器存储的计算机执行指令,使得处理器执行本发明任一实施例中的基于知识图谱的地理空间信息查询方法。
处理器可以是中央处理单元(CPU),还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通过处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可用于储存计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现电子设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器还可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,只能存储卡(SMC),安全数字(SD)卡,闪存卡、至少一个磁盘存储期间、闪存器件、或其他易失性固态存储器件。
实施例4:
本实施例还提供了一种计算机可读存储介质,其中存储有多条指令,指令由处理器加载,使处理器执行本发明任一实施例中的基于知识图谱的地理空间信息查询方法。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RYM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于知识图谱的地理空间信息查询方法,其特征在于,该方法具体如下:
构建地理知识图谱:基于地图、影像、地形、属性以及元数据的基础地理信息数据以及网络百科全书数据构建地理知识图谱;
提示用户输入查询信息:接收用户问句,并提取用户问句包含的意图和实体;
构建查询算子:对用户输入的自然语言进行分词,提取查询标签及查询关系构建查询算子;
查找地理空间信息:根据查询算子从知识图谱数据中查找到相关地理空间信息,并返回查询结果;
展示查询结果:展示查询结果中地理对象、关联关系、属性及空间位置的信息。
2.根据权利要求1所述的基于知识图谱的地理空间信息查询方法,其特征在于,构建地理知识图谱具体如下:
设计地理知识图谱的存储结构、地理实体的存储结构和地理语料库的存储结构;
通过网络百科全书和地理数据库构建地理知识图谱的数据来源,提取网络百科全书和/或地理数据库的信息存储至地理实体结构;
从已融合的知识中提取空间关系;其中,空间关系包括拓扑关系及方向关系;
采用知识图谱存储工具将融合后的地理知识以图结构的方式存储。
3.根据权利要求2所述的基于知识图谱的地理空间信息查询方法,其特征在于,设计地理知识图谱的存储结构、地理实体的存储结构和地理语料库的存储结构具体如下:
地理知识图谱的存储结构采用图结构存储,地理知识图谱的存储结构表示为:KG=(E,R,L);其中,E是一组实体;R是一组带标签的有向边;L是一组文字;一个完整的知识图谱KG是一个三元组,表示为其中E中的实体代表真实世界的实体,有向边R代表真实世界的实体关系和实体属性;
地理实体的存储结构表示为:E1=∑e;其中,E1表示地理实体之和;e表示一个地理实体;一个地理实体e被关系r修饰后才会具有地理意义;其中,e∈E;r∈R;
地理语料库的存储结构表示为:地理语料库为C,地理实体n∈C,n被表示为一个三元组n=<i,l,T>;其中,i表示地理实体在语料库中的编号,是与其余地理实体的区分的关键依据;使用l属性记录地理实体的空间位置信息;T表示多个成对键值对的集合,T用于描述地理实体在现实空间中的意义。
4.根据权利要求2所述的基于知识图谱的地理空间信息查询方法,其特征在于,通过网络百科全书和地理数据库构建地理知识图谱的数据来源,提取网络百科全书和/或地理数据库的信息存储至地理实体结构具体如下:
若网络百科全书和地理数据库的实体结构同时描述,但信息记录内容不完全一致,则认为地理数据库中的信息准确,采用地理数据库中的信息为准,对齐形成地理实体节点;
提取网络百科全书中的信息是通过实体名称打开百科全书条目后,提取信息框中的属性名称和值;对于提取的实体中存在的属性值,根据属性名称构建对象特性;
提取地理数据库的信息实体时,空间数据库包括一个表列表,每个表都包含若干行,即地理图形特征,实体名称和特性字段之间的对应关系用于形成对,用于描述关系;运用自然语言处理和文本挖掘技术,从文本及图像的非结构化数据中识别出与地理空间信息相关的实体,用三元组的形式表示,包括地理实体、属性和关系;
实体层的融合是不同数据中不同标识实体的语义理解,关联到同一实体上,实现对同名、多名和缩写的多种实体语义的消歧;具体为:先生成候选地理实体,通过地理实体指称项从地理知识库中选取候选地理实体;再对候选实体排序,通过标注训练数据集训练候选实体排序模型;模型预测地理节点n和候选地理实体e是否代表同一真实世界实体,并为预测提供置信度评分;最后,在节点n的分类候选对中选择具有最高置信度的地理实体建立正确身份链接。
5.根据权利要求1所述的基于知识图谱的地理空间信息查询方法,其特征在于,构建查询算子具体如下:
提取查询标签:查询标签用于描述查询主题或领域的关键词或短语;提取查询标签具体为:先对用户的查询请求进行文本处理,文本处理包括分词、去除停用词及词干提取;再使用关键词提取算法的文本挖掘技术从处理后的文本中提取出查询标签;
提取查询关系:查询关系用于表示地理空间信息之间的联系或关系;提取查询关系具体为:对地理知识图谱中的实体和概念进行分析,以确定实体和概念之间的语义关系;
使用依存句法分析及命名实体识别的自然语言处理技术从用户的查询请求中识别出与语义关系相关的关键词或短语;
利用与语义相关的关键词或短语构建查询关系。
6.根据权利要求1所述的基于知识图谱的地理空间信息查询方法,其特征在于,地理空间信息的查询条件构建时,结合地理知识图谱和自然语言处理技术,将用户的自然语言查询请求转换为图谱查询语言,从而实现对地理知识图谱的查询和检索;并利用地理知识图谱的结构特点,对图谱中的实体、概念以及关系进行分析和处理,从而得到符合条件的地理空间信息。
7.根据权利要求1所述的基于知识图谱的地理空间信息查询方法,其特征在于,展示查询结果具体如下:
获取查询结果所得的各个点数据信息和边数据信息;
将获取到的点数据信息填充到数据列表中;
以目标点为基础绘制地理知识图谱;
将知识图谱和数据列表双向绑定;
将数据列表中的每个条目绑定模态框与三维地理场景进行联动;
其中,地理知识图谱展示点数据信息及边数据信息,并按照点数据的属性和边数据的属性对地理知识图谱进行过滤和重构;初始的地理知识图谱展示所有的点数据信息和边数据信息,以最终得到的目标搜索点为中心,其余数据点平铺在场景上,相关点之间以直线相连表示两点之间存在关系;
数据列表展示点数据信息,并按照不同字段对数据进行过滤和排序;初始的空数据列表只显示表头,分别为ID、名字和类型三项,ID、名字和类型分别展示地理实体的ID编码,名字和数据类型;数据列表将分条目自上而下展示每一个点数据信息,搜索的目标点数据作为数据列表的第一项,其余点数据依次排开。
8.一种基于知识图谱的地理空间信息查询系统,其特征在于,该系统用于实现权利要求1-7中任一项所述的基于知识图谱的地理空间信息查询方法;该系统包括:
地理知识图谱构建模块,用于构建地理信息知识库;
提取模块,用于接收用户问句,并提取该用户问句包含的意图和实体;
查询语句构建模块,用于根据用户问句匹配的查询模板,构建对应的查询语句;
查询模块,用于根据构建的查询语句,查询知识图谱数据,并返回查询结果;
展示模块,用于展示查询结果中地理对象、关联关系、属性及空间位置的信息。
9.一种电子设备,其特征在于,包括:存储器和至少一个处理器;
其中,所述存储器上存储有计算机程序;
所述至少一个处理器执行所述存储器存储的计算机程序,使得所述至少一个处理器执行如权利要求1至7任一项所述的基于知识图谱的地理空间信息查询方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序可被处理器执行以实现如权利要求1至7中任一项所述的基于知识图谱的地理空间信息查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311550744.6A CN117633033A (zh) | 2023-11-20 | 2023-11-20 | 基于知识图谱的地理空间信息查询方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311550744.6A CN117633033A (zh) | 2023-11-20 | 2023-11-20 | 基于知识图谱的地理空间信息查询方法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117633033A true CN117633033A (zh) | 2024-03-01 |
Family
ID=90035005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311550744.6A Pending CN117633033A (zh) | 2023-11-20 | 2023-11-20 | 基于知识图谱的地理空间信息查询方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117633033A (zh) |
-
2023
- 2023-11-20 CN CN202311550744.6A patent/CN117633033A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Vasardani et al. | Locating place names from place descriptions | |
CN111694965B (zh) | 一种基于多模态知识图谱的图像场景检索系统及方法 | |
Duckham et al. | Foundations of geographic information science | |
WO2006133538A1 (en) | System and method for ranking web content | |
CN102893280A (zh) | 数据搜索装置、数据搜索方法和程序 | |
CN106095738A (zh) | 推荐表单片段 | |
CN112966053B (zh) | 一种基于知识图谱的海洋领域专家库构建方法及装置 | |
Ardissono et al. | Exploration of cultural heritage information via textual search queries | |
Souza et al. | The role of gazetteers in geographic knowledge discovery on the web | |
Kim et al. | Landmark extraction from web-harvested place descriptions | |
CN112711645B (zh) | 一种位置点信息扩展方法、装置、存储介质和电子设备 | |
CN116662583B (zh) | 一种文本生成方法、地点检索方法及相关装置 | |
Kayed et al. | Postal address extraction from the web: a comprehensive survey | |
Mata | Geographic information retrieval by topological, geographical, and conceptual matching | |
Zhang et al. | Enrichment of topographic road database for the purpose of routing and navigation | |
CN117633033A (zh) | 基于知识图谱的地理空间信息查询方法、系统、设备及介质 | |
Bui | Automatic construction of POI address lists at city streets from geo-tagged photos and web data: a case study of San Jose City | |
CN114513550A (zh) | 一种地理位置信息的处理方法、装置及电子设备 | |
CN115827881A (zh) | 一种基于旅游知识图谱的多模态旅游信息定位式检索方法 | |
CN114741518A (zh) | 列车故障知识图谱的构建方法、故障分析方法与存储介质 | |
Clemens | Qualitative comparison of geocoding systems using OpenStreetMap data | |
Sergeeva et al. | Semagr: semantic method for accurate geolocations reconstruction within extensive urban sites | |
Mauro et al. | Thematic Maps for Geographical Information Search | |
Gao et al. | Association and Recomendation for Geosciences Data Attributes Based on Semantic Similarity Measurement | |
Heinzle et al. | Spatial data interpretation for the intelligent access to spatial information in the internet |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |