CN116304217A - 地理空间数据查询方法、装置、电子设备和可读存储介质 - Google Patents
地理空间数据查询方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN116304217A CN116304217A CN202310340849.2A CN202310340849A CN116304217A CN 116304217 A CN116304217 A CN 116304217A CN 202310340849 A CN202310340849 A CN 202310340849A CN 116304217 A CN116304217 A CN 116304217A
- Authority
- CN
- China
- Prior art keywords
- grammar
- data
- query
- query statement
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000006243 chemical reaction Methods 0.000 claims abstract description 21
- 238000012549 training Methods 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims 1
- 238000012732 spatial analysis Methods 0.000 abstract description 6
- 238000000605 extraction Methods 0.000 description 8
- 238000003058 natural language processing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Remote Sensing (AREA)
- Library & Information Science (AREA)
- Machine Translation (AREA)
Abstract
本申请的实施例提供了一种地理空间数据查询方法、装置、电子设备和可读存储介质,该方法包括:获取查询语句;若所述查询语句的语法不符合目标语法,则通过训练完成的转换模型将所述查询语句的语法转换为所述目标语法;基于转换后的所述查询语句在图数据库中进行地理空间数据的查询,所述图数据库能够识别符合所述目标语法的查询语句。本申请能够使得用户在掌握至少一种语法的查询语句时也可以在图数据中进行复杂空间分析或空间查询,进而降低了用户使用的难度。
Description
技术领域
本申请的实施例涉及数据处理技术领域,尤其涉及一种地理空间数据查询方法、装置、电子设备和可读存储介质。
背景技术
随着地理信息系统中对知识图谱的应用越来越广泛,更多地理空间数据以图数据的方式存储。目前,在不同的图数据库中检索所使用的检索语法不同,用户需要掌握多种检索语法,增加了用户在进行复杂空间分析或空间查询的难度。
发明内容
为了降低用户在进行复杂空间分析或空间查询的难度,在图数据库中提升对空间分析和空间检索的效率,本申请的实施例提供了一种地理空间数据查询方法、装置、电子设备和可读存储介质。
在本申请的第一方面,提供了一种地理空间数据查询方法,包括:
获取查询语句;
若所述查询语句的语法不符合目标语法,则通过训练完成的转换模型将所述查询语句的语法转换为所述目标语法;
基于转换后的所述查询语句在图数据库中进行地理空间数据的查询,所述图数据库能够识别符合所述目标语法的查询语句。
在一种可能的实现方式中,所述目标语法为OpenCypher语法。
在一种可能的实现方式中,所述转换模型的训练方法包括:
获取训练样本,所述训练样本包括多组数据,每组数据均包括相对应的不符合所述目标语法的查询语句和符合所述目标语法的查询语句;
利用所述训练样本和预训练的BART模型,训练得到所述转换模型。
在一种可能的实现方式中,所述图数据库具有九交模型接口。
在一种可能的实现方式中,构建所述图数据库的方法包括:
获取地理空间数据;
建立所述地理空间数据中空间地理要素和网格的关系图谱,所述网格由所述地理空间数据拆分得到;
基于所述地理空间数据构建九交模型。
在一种可能的实现方式中,所述地理空间数据包括结构化数据、半结构化数据以及非结构化数据。
在一种可能的实现方式中,还包括:若所述查询语句的语法符合所述目标语法,则基于所述查询语句在图数据库中进行地理空间数据的查询。
在本申请的第二方面,提供了一种地理空间数据查询装置,包括:
获取模块,用于获取查询语句;
转换模块,用于在所述查询语句的语法不符合目标语法时,通过训练完成的转换模型将所述查询语句的语法转换为所述目标语法;
查询模块,用于基于转换后的所述查询语句在图数据库中进行地理空间数据的查询,所述图数据库能够识别符合所述目标语法的查询语句。
在本申请的第三方面,提供了一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如第一方面中任一项所述的方法。
在本申请的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面中任一项所述的方法。
在本申请实施例提供的地理空间数据查询方法、装置、电子设备和可读存储介质中,由于在不同的图数据库中检索所使用的检索语法不同,从而导致用户需要掌握多种检索语法,本申请实施例中通过将不符合目标语法的查询语句,通过转换模型转换成符合目标语法的查询语句,从而在图数据(能够识别目标语法)中进行地理空间数据的查询,从而使得用户在掌握至少一种语法的查询语句时也可以在图数据中进行复杂空间分析或空间查询,进而降低了用户使用的难度。
应当理解,发明内容部分中所描述的内容并非旨在限定本申请的实施例的关键或重要特征,亦非用于限制本申请的范围。本申请的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本申请各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示出了根据本申请的实施例的地理空间数据查询方法的流程图;
图2示出了根据本申请的实施例的转换模型的训练方法的流程图;
图3示出了根据本申请的实施例的图数据库的构建方法的流程图;
图4示出了根据本申请的实施例的网格拆分结果示意图;
图5示出了根据本申请的实施例的九交模型的示意图;
图6示出了根据本申请的实施例的地理空间数据查询装置的方框图;
图7示出了根据本申请的实施例的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
参见图1,地理空间数据查询方法包括以下步骤:
步骤101,获取查询语句。
步骤102,若查询语句的语法不符合目标语法,则通过训练完成的转换模型将查询语句的语法转换为目标语法。
步骤103,基于转换后的查询语句在图数据库中进行地理空间数据的查询,图数据库能够识别符合目标语法的查询语句。
目标语法的类型可以基于图数据库的类型来进行设定。
例如,图数据库能够识别某种语法的语句,则可以将该种类的语法确定为目标语法。
例如,不同图数据库能够识别不同的检索语法,如:ArrangoDB能够识别AQL检索语法,Neo4j能够识别Cypher检索语法。
若图数据库选择ArrangoDB,则目标语法为AQL检索语法;若图数据选择Neo4j,则目标语法为Cypher检索语法。
例如,目标语法可以为OpenCypher语法,OpenCypher语法为在Cypher检索语法的基础上扩展出带有空间分析函数的语法,OpenCypher语法继承了Cypher语法。
例如,OpenCypher的基本语法如下:
基本查询语法形式:match(n1)-[r]-(n2)returnn1,r,n2,其可以查询所有实体和实体之间的关系组合;
基于条件的查询语句:match(n1:Person{name:Bill})-[r:ferend]-(n2)wheren2.age<35returnn2,即查询名为Bill小于35岁的朋友;
基于空间的查询语句:match(n1:build)-[]-(n2:river)where Buffer(200),即查询了河流实体200米范围内的所有建筑物实体。
例如,OpenCypher中支持空间查询的函数如下:
Buffer:缓存查询,可以设置缓存半径,单位:米,主要用于查询某地理实体周边指定范围内的地理实体;
Intersect:相交查询,查询与某一地理实体相交的地理实体;
Contain:包含查询,查询某地理实体完全包含的地理实体;
Isequal:相同查询,查询两个地理实体是否完全相同;
Within:被包含查询,查询包含指定地理实体的地理实体;
Disconect:相连查询,查询两个地理实体是否相连,用于线和线地理实体的计算;
Istouch:接触查询,查询两个地理实体是否有接触。
例如,ArrangoDb中:
letquery_client_uuid=@query_client_uuidFOR`n`IN UNION(FOR`n`IN`Document`RETURN`n`,
FOR`n`IN`competeproduct`RETURN`n`,
FOR`n`IN`conference`RETURN`n`,
FOR`n`IN`file`RETURN`n`,
FOR`n`IN`filetype`RETURN`n`,
FOR`n`IN`industry`RETURN`n`,
FOR`n`IN`location`RETURN`n`,
FOR`n`IN`person`RETURN`n`,
FOR`n`IN`product`RETURN`n`,
FOR`n`IN`role`RETURN`n`,
FOR`n`IN`techfield`RETURN`n`,
FOR`n`IN`version`RETURN`n`)RETURN{`n`:`n`},
均可以转换为match(n)returnn的形式。
例如,将检索语句输入至图数据库中,图数据库不能够识别该检索语句,则说明该检索语句不符合目标语法。
例如,将检索语句输入至图数据库中,图数据库能够识别该检索语句,则说明该检索语句符合目标语法,则可直接基于该检索语句在图数据库中进行查询。
转换模型可以为BART模型,其可以由训练样本和预训练的BART模型训练得到。
例如,参见图2,转换模型的训练方法包括以下步骤:
步骤201,获取训练样本。
步骤202,利用训练样本和预训练的BART模型,训练得到转换模型。
其中,训练样本包括多组数据,每组数据均包括相对应的不符合目标语法的查询语句和符合目标语法的查询语句。
例如,训练样本包括:
FOR`n`IN`competeproduct`RETURN`n`,match(n)returnn;
FOR`n`IN`product`RETURN`n`,match(n)returnn;
……
需要说明的是,上述示例仅是以训练样本包括ArrangoDb所支持的AQL检索语法为例来进行说明,并不构成对本申请实施例中训练样本的限制,其他任意检索语法均可,只要其能够转换为目标语法(本申请实施例中仅是以OpenCypher语法为例)即可。
例如,训练过程中,可以采用新的随机初始化Encoder替换BART编码器的Embedding层。该模型以端到端的方式进行训练,即训练一个新的编码器将外来词映射到输入。新的编码器可以使用不同于原始BART模型的词汇。其中随机初始化Encoder的训练分两步,均需要将来自BART模型输出的交叉熵损失进行反向传播。
第一步,冻结BART的大部分参数,仅更新随机初始化的Encoder、BART位置嵌入和BART编码器第一层的自注意力输入投影矩阵。
第二步,将所有模型参数进行少量迭代训练。
例如,参见图3,图数据库的构建方法如下:
步骤301,获取地理空间数据。
例如,地理空间数据可以基于原始数据来进行获取。
例如,原始数据可以包括结构化数据、半结构化数据以及非结构化数据。
例如,结构化数据也就是表格类数据。在地理信息科学(GIS)领域,常用的GIS数据格式如要素类、Shapefile、地理数据库都属这一类。
例如,半结构化数据指的是JSON、HTML这类可以结构化但无法固定结构的数据。
例如,非结构化数据指的是如图片、文档、视频这类数据类型。
例如,结构化数据可以包括结构化地理空间数据和结构化非地理空间数据。
例如,可以预先构建一个知识图谱概念模型,并基于该知识图谱概念模型,从原始数据中进行知识抽取得到地理空间数据。
需要说明的是,不同类型的原始数据,可以根据知识图谱概念模型最终应用层需求的不同,其对应的数据采集和信息抽取的过程不尽相同,可以分为如下几类:
针对结构化地理空间数据:其包括空间数据和属性数据。其中,空间数据描述地理要素的空间几何特征,属性数据描述地理要素所具有的属性特征。针对属性数据,可按照知识图谱概念模型中定义完成的属性信息进行提取;针对空间数据,由于图数据库往往不支持直接导入,因此需要将其转化为一种通用格式(如GIS数据格式);
针对结构化非地理空间数据:由于其不含有空间数据,可以对照知识图谱概念模型直接导出需要提取的属性字段,可存储为CSV、TXT等通用结构化数据交换格式;
针对半结构化数据:若其中不包含空间信息,可根据知识图谱概念模型,采用数据处理方式提取出需要的属性信息,存为CSV、TXT等通用结构化数据交换格式;若其中含有空间信息,则可以转化为GeoJSON格式进行存储;
针对非结构化数据:可以根据知识图谱概念模型,一些非结构化数据如PDF、图片、视频等,无需进一步处理,只需作为附件关联至知识图谱中的某一实体或关系。
例如,针对文本类数据,若其中包含实体和关系信息,建议采用自然语言处理(NaturalLanguageProcessing,NLP)进行批量化的提取。
例如,在实体抽取方面,BERT模型是一个面向自然语言处理任务的无监督预训练语言模型,是近年来自然语言处理领域公认的里程碑模型。在中文NLP领域,Bert-base-chinese模型是原始Bert模型针对中文进行训练后的预训练模型,在命名实体识别(NamedEntityRecognition,NER)和文本分类(TextClassification,TC)方面拥有较高精度。故针对文本类数据,可采用Bert-base-chinese模型进行实体的抽取。
例如,关系抽取可以采用如下方式:
(1)若文本中的关系比较简单,且大量重复出现,如“西坝河中里小区属于香河园街道”、“光熙门北里小区属于香河园街道”,则可以使用基于规则的关系提取方法,如正则表达式、基于依存关系(语法树)进行实体间关系的快速提取。
(2)基于有监督神经网络方法是指采用深度学习方法在大规模有监督数据集上训练模型,模型主体结构是特征提取器+关系分类器。其中,特征提取器可采用BERT、LSTM、CNN等模型;
针对包含地名地址的文本类数据,其中的地名地址由于在物理世界中对应相应的实体,在使用Bert-base-chinese模型提取出相应的地名或地址实体后,可采用地理编码的方式,将地名或地址转化为经纬度坐标,进而在提取过程中添加数据的空间属性。
例如,在数据采集和信息抽取完成后,可以对采集和抽取到的数据进行实体消歧和实体统一,其具体方式此处不再赘述。
步骤302,建立地理空间数据中空间地理要素和网格的关系图谱,网格由地理空间数据拆分得到。
例如,可以将地理空间数据拆分得到18级网格,如图4所示。
例如,可以从地理空间数据的左上角开始计算,将其拆分为18级网格。
例如,网格的命名方式可以为{level}-{row}-{col}形式。
例如,第1级1行1列网格命名为1-1-1,即左上角开始的第一个网格。
例如,每个网格数据形成一个网格实体,同时构建不同等级网格间的包含关系:如1-1-1网格包含:2-1-1,2-1-2,2-2-1,2-2-2,将名称为1-1-1网格实体和4个网格实体,以及4条包含关系,4个在网格实体将构建兄弟关系,最终将基于网格实体构建一个树状结构的网格关系图谱。
例如,可以逐条读取地理空间数据,计算每条数据的最大外包矩形作为空间地理要素。
例如,可以逐条读取空间地理要素,并计算和上述构建的实体直接的空间关系:包含,相交。并将空间地理要素转为空间地理要素实体,空间关系转换成图谱关系,最终生成空间要素和网格的关系图谱。如:建筑物:1号楼——相交——网格:2-2-1。
基于上述方式建立地理空间数据中空间地理要素和网格的关系图谱。
步骤303,基于地理空间数据构建九交模型。
例如,九交模型为空间数据九交模型,如图5所示。
例如,可以基于OGC定义的九交模型的标准,在上述空间地理要素和网格的关系图谱的基础上,研发一套基于图数据库关系的空间分析和查询模块。
根据本申请实施例,由于在不同的图数据库中检索所使用的检索语法不同,从而导致用户需要掌握多种检索语法,本申请实施例中通过将不符合目标语法的查询语句,通过转换模型转换成符合目标语法的查询语句,从而在图数据(能够识别目标语法)中进行地理空间数据的查询,从而使得用户在掌握至少一种语法的查询语句时也可以在图数据中进行复杂空间分析或空间查询,进而降低了用户使用的难度。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
以上是关于方法实施例的介绍,以下通过装置实施例,对本申请所述方案进行进一步说明。
参见图6,地理空间数据查询装置包括获取模块601、转换模块602以及查询模块603。
获取模块601,用于获取查询语句。
转换模块602,用于在所述查询语句的语法不符合目标语法时,通过训练完成的转换模型将所述查询语句的语法转换为所述目标语法;
查询模块603,用于基于转换后的所述查询语句在图数据库中进行地理空间数据的查询,所述图数据库能够识别符合所述目标语法的查询语句。
例如,目标语法为OpenCypher语法。
例如,地理空间数据查询装置还包括训练模块,该训练模块用于:获取训练样本,训练样本包括多组数据,每组数据均包括相对应的不符合目标语法的查询语句和符合目标语法的查询语句;利用训练样本和预训练的BART模型,训练得到转换模型。
例如,图数据库具有九交模型接口。
例如,地理空间数据查询装置还包括构建模块,该构建模块用于:获取地理空间数据;建立地理空间数据中空间地理要素和网格的关系图谱,网格由地理空间数据拆分得到;基于地理空间数据构建九交模型。
例如,地理空间数据包括结构化数据、半结构化数据以及非结构化数据。
例如,查询模块603,还用于在查询语句的语法符合目标语法时,基于查询语句在图数据库中进行地理空间数据的查询。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例中提供了一种电子设备,如图7所示,图7所示的电子设备700包括:处理器701和存储器703。其中,处理器701和存储器703相连,如通过总线702相连。可选地,电子设备700还可以包括收发器704。需要说明的是,实际应用中收发器704不限于一个,该电子设备700的结构并不构成对本申请实施例的限定。
处理器701可以是CPU(CentralProcessingUnit,中央处理器),通用处理器,DSP(DigitalSignalProcessor,数据信号处理器),ASIC(ApplicationSpecificIntegratedCircuit,专用集成电路),FPGA(FieldProgrammableGateArray,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器701也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线702可包括一通路,在上述组件之间传送信息。总线702可以是PCI(PeripheralComponentInterconnect,外设部件互连标准)总线或EISA(ExtendedIndustryStandardArchitecture,扩展工业标准结构)总线等。总线702可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器703可以是ROM(ReadOnlyMemory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(RandomAccessMemory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(ElectricallyErasableProgrammableReadOnlyMemory,电可擦可编程只读存储器)、CD-ROM(CompactDiscReadOnlyMemory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器703用于存储执行本申请方案的应用程序代码,并由处理器701来控制执行。处理器701用于执行存储器703中存储的应用程序代码,以实现前述方法实施例所示的内容。
其中,电子设备包括但不限于:移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图7示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种地理空间数据查询方法,其特征在于,包括:
获取查询语句;
若所述查询语句的语法不符合目标语法,则通过训练完成的转换模型将所述查询语句的语法转换为所述目标语法;
基于转换后的所述查询语句在图数据库中进行地理空间数据的查询,所述图数据库能够识别符合所述目标语法的查询语句。
2.根据权利要求1所述的方法,其特征在于,所述目标语法为OpenCypher语法。
3.根据权利要求1所述的方法,其特征在于,所述转换模型的训练方法包括:
获取训练样本,所述训练样本包括多组数据,每组数据均包括相对应的不符合所述目标语法的查询语句和符合所述目标语法的查询语句;
利用所述训练样本和预训练的BART模型,训练得到所述转换模型。
4.根据权利要求1所述的方法,其特征在于,所述图数据库具有九交模型接口。
5.根据权利要求4所述的方法,其特征在于,构建所述图数据库的方法包括:
获取地理空间数据;
建立所述地理空间数据中空间地理要素和网格的关系图谱,所述网格由所述地理空间数据拆分得到;
基于所述地理空间数据构建九交模型。
6.根据权利要求1所述的方法,其特征在于,所述地理空间数据包括结构化数据、半结构化数据以及非结构化数据。
7.根据权利要求5所述的方法,其特征在于,还包括:
若所述查询语句的语法符合所述目标语法,则基于所述查询语句在图数据库中进行地理空间数据的查询。
8.一种地理空间数据查询装置,其特征在于,包括:
获取模块,用于获取查询语句;
转换模块,用于在所述查询语句的语法不符合目标语法时,通过训练完成的转换模型将所述查询语句的语法转换为所述目标语法;
查询模块,用于基于转换后的所述查询语句在图数据库中进行地理空间数据的查询,所述图数据库能够识别符合所述目标语法的查询语句。
9.一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310340849.2A CN116304217B (zh) | 2023-03-31 | 2023-03-31 | 地理空间数据查询方法、装置、电子设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310340849.2A CN116304217B (zh) | 2023-03-31 | 2023-03-31 | 地理空间数据查询方法、装置、电子设备和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116304217A true CN116304217A (zh) | 2023-06-23 |
CN116304217B CN116304217B (zh) | 2024-04-26 |
Family
ID=86822361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310340849.2A Active CN116304217B (zh) | 2023-03-31 | 2023-03-31 | 地理空间数据查询方法、装置、电子设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116304217B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001071538A2 (en) * | 2000-03-21 | 2001-09-27 | Quack.Com | System and method for non-programming development of rules used in the transformation of web-based information |
CN103189860A (zh) * | 2010-11-05 | 2013-07-03 | Sk普兰尼特有限公司 | 组合句法转换模型与词汇转换模型的机器翻译装置和机器翻译方法 |
CN105205092A (zh) * | 2014-06-21 | 2015-12-30 | 谷歌公司 | 基于瓦片将可搜索地理空间数据分配到客户端装置 |
US20160350367A1 (en) * | 2015-05-27 | 2016-12-01 | Mark Fischer | Mechanisms For Querying Disparate Data Storage Systems |
US20170206271A1 (en) * | 2016-01-20 | 2017-07-20 | Facebook, Inc. | Generating Answers to Questions Using Information Posted By Users on Online Social Networks |
US20180032930A1 (en) * | 2015-10-07 | 2018-02-01 | 0934781 B.C. Ltd | System and method to Generate Queries for a Business Database |
TW201933148A (zh) * | 2018-01-26 | 2019-08-16 | 中華電信股份有限公司 | 多階層網路交互關係查找方法 |
CN110347736A (zh) * | 2019-06-21 | 2019-10-18 | 厦门美域中央信息科技有限公司 | 一种面向rdf三元组的数据自定义映射方法 |
CN111125294A (zh) * | 2020-03-31 | 2020-05-08 | 武汉中科通达高新技术股份有限公司 | 一种空间关系的知识图谱数据模型表示方法及系统 |
CN111368049A (zh) * | 2020-02-26 | 2020-07-03 | 京东方科技集团股份有限公司 | 信息获取方法、装置、电子设备及计算机可读存储介质 |
CN111986759A (zh) * | 2020-08-31 | 2020-11-24 | 平安医疗健康管理股份有限公司 | 电子病历的解析方法、系统、计算机设备与可读存储介质 |
US20210019309A1 (en) * | 2019-07-16 | 2021-01-21 | Thoughtspot, Inc. | Mapping Natural Language To Queries Using A Query Grammar |
US20220050840A1 (en) * | 2020-08-12 | 2022-02-17 | Oracle International Corporation | Natural language query translation based on query graphs |
CN115129719A (zh) * | 2022-06-28 | 2022-09-30 | 深圳市规划和自然资源数据管理中心 | 一种基于知识图谱的定性位置空间范围构建方法 |
CN115470232A (zh) * | 2022-09-29 | 2022-12-13 | 阿里巴巴(中国)有限公司 | 模型训练和数据查询方法、装置、电子设备和存储介质 |
-
2023
- 2023-03-31 CN CN202310340849.2A patent/CN116304217B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001071538A2 (en) * | 2000-03-21 | 2001-09-27 | Quack.Com | System and method for non-programming development of rules used in the transformation of web-based information |
CN103189860A (zh) * | 2010-11-05 | 2013-07-03 | Sk普兰尼特有限公司 | 组合句法转换模型与词汇转换模型的机器翻译装置和机器翻译方法 |
CN105205092A (zh) * | 2014-06-21 | 2015-12-30 | 谷歌公司 | 基于瓦片将可搜索地理空间数据分配到客户端装置 |
US20160350367A1 (en) * | 2015-05-27 | 2016-12-01 | Mark Fischer | Mechanisms For Querying Disparate Data Storage Systems |
US20180032930A1 (en) * | 2015-10-07 | 2018-02-01 | 0934781 B.C. Ltd | System and method to Generate Queries for a Business Database |
US20170206271A1 (en) * | 2016-01-20 | 2017-07-20 | Facebook, Inc. | Generating Answers to Questions Using Information Posted By Users on Online Social Networks |
TW201933148A (zh) * | 2018-01-26 | 2019-08-16 | 中華電信股份有限公司 | 多階層網路交互關係查找方法 |
CN110347736A (zh) * | 2019-06-21 | 2019-10-18 | 厦门美域中央信息科技有限公司 | 一种面向rdf三元组的数据自定义映射方法 |
US20210019309A1 (en) * | 2019-07-16 | 2021-01-21 | Thoughtspot, Inc. | Mapping Natural Language To Queries Using A Query Grammar |
CN111368049A (zh) * | 2020-02-26 | 2020-07-03 | 京东方科技集团股份有限公司 | 信息获取方法、装置、电子设备及计算机可读存储介质 |
CN111125294A (zh) * | 2020-03-31 | 2020-05-08 | 武汉中科通达高新技术股份有限公司 | 一种空间关系的知识图谱数据模型表示方法及系统 |
US20220050840A1 (en) * | 2020-08-12 | 2022-02-17 | Oracle International Corporation | Natural language query translation based on query graphs |
CN111986759A (zh) * | 2020-08-31 | 2020-11-24 | 平安医疗健康管理股份有限公司 | 电子病历的解析方法、系统、计算机设备与可读存储介质 |
CN115129719A (zh) * | 2022-06-28 | 2022-09-30 | 深圳市规划和自然资源数据管理中心 | 一种基于知识图谱的定性位置空间范围构建方法 |
CN115470232A (zh) * | 2022-09-29 | 2022-12-13 | 阿里巴巴(中国)有限公司 | 模型训练和数据查询方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116304217B (zh) | 2024-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wing et al. | Simple supervised document geolocation with geodesic grids | |
CN111488426A (zh) | 一种查询意图确定方法、装置及处理设备 | |
CN111159343A (zh) | 基于文本嵌入的文本相似性搜索方法、装置、设备和介质 | |
CN110795541B (zh) | 文本查询方法、装置、电子设备及计算机可读存储介质 | |
CN113515589B (zh) | 数据推荐方法、装置、设备以及介质 | |
Younis et al. | Hybrid geo-spatial query methods on the Semantic Web with a spatially-enhanced index of DBpedia | |
Fize et al. | Deep learning for toponym resolution: Geocoding based on pairs of toponyms | |
Mai et al. | On the opportunities and challenges of foundation models for geoai (vision paper) | |
Kulkarni et al. | Multi-level gazetteer-free geocoding | |
CN113505190B (zh) | 地址信息修正方法、装置、计算机设备和存储介质 | |
Tanaka et al. | Instructdoc: A dataset for zero-shot generalization of visual document understanding with instructions | |
Cheng et al. | Quickly locating POIs in large datasets from descriptions based on improved address matching and compact qualitative representations | |
Balsebre et al. | Mining geospatial relationships from text | |
CN116578724B (zh) | 知识库知识结构构建方法及装置、存储介质和终端 | |
Kannadasan et al. | Personalized query auto-completion through a lightweight representation of the user context | |
CN116304217B (zh) | 地理空间数据查询方法、装置、电子设备和可读存储介质 | |
CN116186220A (zh) | 信息检索方法、问答处理方法、信息检索装置及系统 | |
CN112579774B (zh) | 模型训练方法、模型训练装置及终端设备 | |
Formica et al. | Constraint relaxation of the polygon-polyline topological relation for geographic pictorial query languages | |
NAFIS et al. | Towards a semantic recommender system for cultural objects: Case study Draa-Tafilalet region | |
CN116991877B (zh) | 一种结构化查询语句的生成方法、装置及应用 | |
CN110688446B (zh) | 一种句义数学空间表示方法、系统、介质和设备 | |
CN114385903B (zh) | 应用账号的识别方法、装置、电子设备及可读存储介质 | |
Kolkman | Cross-domain textual geocoding: the influence of domain-specific training data | |
Li et al. | An Entity-Based Fine-Grained Geolocalization of User Generated Short Text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |