CN117391088A - 一种语义一致性检查方法及装置 - Google Patents

一种语义一致性检查方法及装置 Download PDF

Info

Publication number
CN117391088A
CN117391088A CN202311094622.0A CN202311094622A CN117391088A CN 117391088 A CN117391088 A CN 117391088A CN 202311094622 A CN202311094622 A CN 202311094622A CN 117391088 A CN117391088 A CN 117391088A
Authority
CN
China
Prior art keywords
semantic information
semantic
geographic entity
check
checking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311094622.0A
Other languages
English (en)
Inventor
刘俊伟
王思宇
唐莉萍
邬丽娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Terry Digital Technology Beijing Co ltd
Original Assignee
Terry Digital Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Terry Digital Technology Beijing Co ltd filed Critical Terry Digital Technology Beijing Co ltd
Priority to CN202311094622.0A priority Critical patent/CN117391088A/zh
Publication of CN117391088A publication Critical patent/CN117391088A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Remote Sensing (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种语义一致性检查方法及装置,所述方法包括:构建地理实体时空知识图谱时获取地理实体的语义信息;对所述地理实体的语义信息进行语义信息标准化检查,得到标准化检查结果;对所述地理实体的语义信息进行语义与几何归一化检查,得到归一化检查结果;将所述标准化检查结果和所述归一化检查结果进行整理并输出。本发明的方法规范了基础地理实体语义一致性的检查,使得实景三维构建过程中规范语义表达,从而在构建地理实体时空知识图谱时保证语义的完整性和一致性。

Description

一种语义一致性检查方法及装置
技术领域
本发明涉及技术领域,特别是一种语义一致性检测方法及装置。
背景技术
实景三维的主要成果内容是地理实体,地理实体表示现实世界的地理对象,在数字世界中采用空间数据、属性数据及关系信息等对地理实体进行描述,基础地理实体数据是“实景”在数字化空间的主要数据表现形式,构建“实景”三维,其实体属性应真实、准确,实体类型表达应全面,场景融合应更加充分,采用基础地理实体数据作为空间信息框架和承载基础。在采集时,要满足实体属性信息全、实体数据空间全、实体建模类型全的要求,同时基础地理实体数据应具备语义化、实体化及轻量化的特点。
“语义化”体现了地理信息从让人理解到人机兼容理解的转变。实景三维的目的就是既能让人理解,更要让机器易懂,即把数字化的空间模型转换成计算机可以理解的表达形式,进一步通过实体编码链接各类关联信息,特别是通过物联网融入人流、物流、车流、事件等实时数据。
实景三维面向新时代新的应用需求,其成果数据要求的变化,导致地理信息质检内容不断更新,新成果质检标准的需求日趋迫切。建设实景三维质检体系,质量标准化建设既是基础,又是引领。健全质量标准体系,既是对测绘地理信息标准体系的充实和完善,又是引领和规范质量标准建设的必然要求。
随着实景三维建设的推进,基础地理实体的语义信息来源广泛,针对行业需求会在原有属性基础上进行扩充,因此,在构建地理实体时空知识图谱的过程中对于实体的语义描述可能会有差异。目前,在进行时空知识图谱构建时缺乏对语义信息的一致性检查,从而影响知识图谱的构建以及更新。因此,现亟需一种可以使得时空知识图谱构建完成性以及统一性的语义一致性检查方案。
发明内容
鉴于上述问题,本发明提出一种克服上述问题或者至少部分地解决上述问题的语义一致性检测方法及装置。
根据本发明的一个方面,提供了一种语义一致性检查方法,所述方法包括:
构建地理实体时空知识图谱时获取地理实体的语义信息;
对所述地理实体的语义信息进行语义信息标准化检查,得到标准化检查结果;
对所述地理实体的语义信息进行语义与几何归一化检查,得到归一化检查结果;
将所述标准化检查结果和所述归一化检查结果进行整理并输出。
可选地,所述对所述地理实体的语义信息进行语义信息标准化检查包括:
对所述语义信息进行语义描述检查,检查语义信息填写是否符合范式规则;
对所述语义信息进行等价语义检查;
对所述语义信息进行同词异义检查;
对所述语义信息进行类型冲突检查;
对所述语义信息进行度量维度检查。
可选地,所述对所述语义信息进行等价语义检查包括:
检查含义一致但表达方式不同的语义信息,用于三元组节点融合。
可选地,所述对所述语义信息进行同词异义检查包括:
对采用了相同描述的词语,但各自表达的对象含义不同的语义信息进行检查。
可选地,所述对所述语义信息进行类型冲突检查包括:
对采用相同描述的词语,但各自表达的内容维度和类型不同的语义信息进行检查。
可选地,所述对所述语义信息进行度量维度检查包括:
对语义信息中同一属性的度量单位进行一致性检查。
可选地,对所述地理实体的语义信息进行语义与几何归一化检查包括:
对所述语义信息进行几何构成关系检查,检查几何组成与地理实体对象的一致性;
对所述语义信息进行几何唯一性检查。
本发明还提供了一种语义一致性检查装置,包括一个或多个处理器以及存储有程序指令对非暂时性计算机可读存储介质,当所述一个或多个处理器执行所述程序指令时,所述一个或多个处理器用于实现根据上述任一项所述的方法。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述任一项所述的方法。
本发明还提供了一种计算设备,其特征在于,所述计算设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行上述任一项所述的方法。
本发明提供了一种语义一致性检查方法及装置,包括语义信息标准化检查及语义与几何归一化检查,其中语义信息标准化检查语义描述的范式、内容是否标准、不应发生语义冲突等情况;几何归一化检查属于地理实体领域知识图谱构建的专有内容。本发明包含实现质检项,并规范了基础地理实体语义一致性的检查,使得实景三维构建过程中规范语义表达,从而在构建地理实体时空知识图谱时保证语义的完整性和一致性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一实施例的语义一致性检查方法流程示意图;
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种语义一致性检查方法,如图1所示,本实施例的语义一致性检查方法至少包括以下步骤S1~S4。
S1,构建地理实体时空知识图谱时获取地理实体的语义信息;本实施例的地理实体语义信息是在建立地理实体时空知识图谱时采集的多个地理实体所对应的语义信息。地理实体的语义信息可以包括用于表征地理实体语义的方位信息、拓扑信息、位置信息、大小信息等数据。除此之外,地理实体的语义信息还可以包括地理实体的几何构成相关信息、类属关系、空间距离等信息。
S2,对所述地理实体的语义信息进行语义信息标准化检查,得到标准化检查结果;语义信息标准化检查,是指检查语义描述的范式、内容是否标准,不应发生语义冲突等情况。
S3,对所述地理实体的语义信息进行语义与几何归一化检查,得到归一化检查结果;基础地理实体数据除了属性信息及概念类别,还具备几何组成结构,该项内容是基于几何构成关系进行的检查,是地理实体领域知识图谱构建的专有内容。
S4,将所述标准化检查结果和所述归一化检查结果进行整理并输出。对于上述标准化检查结果和归一化检查结果可以进行整理,并将整理结果输出以供用户查看。可选地,在进行结果整理时,可以将检查出的一致和不一致的实体及语义信息分别筛选出来以列表的方式输出,供用户查看。
在一些可选实施例中,上述步骤S2对所述地理实体的语义信息进行语义信息标准化检查包括:
(1)对所述语义信息进行语义描述检查,检查语义信息填写是否符合范式规则。
地理实体的语义描述通常按照一定的模板范式进行描述,在进行语义描述检查时,可以检查语义信息填写是否符合范式规则,本实施例中的范式规则可以为“<实体,语义关系,实体>”,或者是“<实体,语义关系,概念>”,当然,实际应用中还可以是其他方式,本实施例对此不做限定。
(2)对所述语义信息进行等价语义检查。
等价语义检查主要用于三元组节点融合,对语义信息进行等价语义检查时,主要检查含义一致但表达方式不同的语义信息。例如“高度”与“高”,“甲乙市”与“甲乙”,可以看做是具有相同的语义,但表达方式不一样。
(3)对所述语义信息进行同词异义检查。
同词异义检查用于实体语义消除歧义,进行同词异义检查时,主要判断语义信息是否采用了相同描述的词语,但各自表达的对象含义不同。如:采用“火车站”一词表达某基础地理实体,可表示火车站这一院落,也可表示火车站这一栋建筑物。
(4)对所述语义信息进行类型冲突检查。
类型冲突检查用于实体语义消除歧义,进行类型冲突检查,主要是判断是否采用相同描述的词语,但各自表达的内容维度和类型不同。如:采用“A市火车站”一词,不仅可以表达A市火车站这一地理实体,也可以表达为一个地址属性项。
(5)对所述语义信息进行度量维度检查。
即,对同一属性度量单位一致性检查,如描述某场地面积,采用了“平方米”或“平方千米”,应统一。
在一些可选实施例中,上述步骤S3对所述地理实体的语义信息进行语义与几何归一化检查包括:
(1)对所述语义信息进行几何构成关系检查,检查几何组成与地理实体对象的一致性。
在进行语义描述时,某实体由图形A和图形B组成,但实际数据的几何构成却包含了图形A、图形B及图形C三种,语义层与几何构成层不一致。
(2)对所述语义信息进行几何唯一性检查。构成某一实体的几何图形不应参与组成其他实体。
基础地理实体的语义信息来源广泛,针对行业需求会在原有属性基础上进行扩充,本实施例通过在构建地理实体时空知识图谱的过程中需要进行语义一致性检查,以保证语义信息的准确性及完整性。对于上述进行一致性检查的地理实体的语义信息可以进行知识图谱的构建,通过基础地理实体语义化内容提取实体关系,然后提取到的关系三元组与知识图谱中已存在的数据作融合,最后经过质量评估,加入到知识图谱中,得到更高效的时空知识图谱构建平台。
本发明实施例还提供了一种语义一致性检查装置,包括一个或多个处理器以及存储有程序指令对非暂时性计算机可读存储介质,当所述一个或多个处理器执行所述程序指令时,所述一个或多个处理器用于实现上述实施例所述的方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述实施例所述的方法。
本发明实施例还提供了一种计算设备,所述计算设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行上述实施例所述的方法。
所属领域的技术人员可以清楚地了解到,上述描述的系统、装置、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,为简洁起见,在此不另赘述。
另外,在本发明各个实施例中的各功能单元可以物理上相互独立,也可以两个或两个以上功能单元集成在一起,还可以全部功能单元都集成在一个处理单元中。上述集成的功能单元既可以采用硬件的形式实现,也可以采用软件或者固件的形式实现。
本领域普通技术人员可以理解:所述集成的功能单元如果以软件的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,其包括若干指令,用以使得一台计算设备(例如个人计算机,服务器,或者网络设备等)在运行所述指令时执行本发明各实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM),磁碟或者光盘等各种可以存储程序代码的介质。
或者,实现前述方法实施例的全部或部分步骤可以通过程序指令相关的硬件(诸如个人计算机,服务器,或者网络设备等的计算设备)来完成,所述程序指令可以存储于一计算机可读取存储介质中,当所述程序指令被计算设备的处理器执行时,所述计算设备执行本发明各实施例所述方法的全部或部分步骤。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:在本发明的精神和原则之内,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案脱离本发明的保护范围。

Claims (10)

1.一种语义一致性检查方法,其特征在于,所述方法包括:
构建地理实体时空知识图谱时获取地理实体的语义信息;
对所述地理实体的语义信息进行语义信息标准化检查,得到标准化检查结果;
对所述地理实体的语义信息进行语义与几何归一化检查,得到归一化检查结果;
将所述标准化检查结果和所述归一化检查结果进行整理并输出。
2.根据权利要求1所述的方法,其特征在于,所述对所述地理实体的语义信息进行语义信息标准化检查包括:
对所述语义信息进行语义描述检查,检查语义信息填写是否符合范式规则;
对所述语义信息进行等价语义检查;
对所述语义信息进行同词异义检查;
对所述语义信息进行类型冲突检查;
对所述语义信息进行度量维度检查。
3.根据权利要求2所述的方法,其特征在于,所述对所述语义信息进行等价语义检查包括:
检查含义一致但表达方式不同的语义信息,用于三元组节点融合。
4.根据权利要求2所述的方法,其特征在于,所述对所述语义信息进行同词异义检查包括:
对采用了相同描述的词语,但各自表达的对象含义不同的语义信息进行检查。
5.根据权利要求2所述的方法,其特征在于,所述对所述语义信息进行类型冲突检查包括:
对采用相同描述的词语,但各自表达的内容维度和类型不同的语义信息进行检查。
6.根据权利要求2所述的方法,其特征在于,所述对所述语义信息进行度量维度检查包括:
对语义信息中同一属性的度量单位进行一致性检查。
7.根据权利要求1所述的方法,其特征在于,对所述地理实体的语义信息进行语义与几何归一化检查包括:
对所述语义信息进行几何构成关系检查,检查几何组成与地理实体对象的一致性;
对所述语义信息进行几何唯一性检查。
8.一种语义一致性检查装置,其特征在于,包括一个或多个处理器以及存储有程序指令对非暂时性计算机可读存储介质,当所述一个或多个处理器执行所述程序指令时,所述一个或多个处理器用于实现根据权利要求1-7中任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-7任一项所述的方法。
10.一种计算设备,其特征在于,所述计算设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-7任一项所述的方法。
CN202311094622.0A 2023-08-29 2023-08-29 一种语义一致性检查方法及装置 Pending CN117391088A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311094622.0A CN117391088A (zh) 2023-08-29 2023-08-29 一种语义一致性检查方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311094622.0A CN117391088A (zh) 2023-08-29 2023-08-29 一种语义一致性检查方法及装置

Publications (1)

Publication Number Publication Date
CN117391088A true CN117391088A (zh) 2024-01-12

Family

ID=89469015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311094622.0A Pending CN117391088A (zh) 2023-08-29 2023-08-29 一种语义一致性检查方法及装置

Country Status (1)

Country Link
CN (1) CN117391088A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897364A (zh) * 2017-01-12 2017-06-27 上海大学 基于事件的中文指代语料库构建方法
CN107341598A (zh) * 2017-06-23 2017-11-10 清华大学 语义和几何计算结合的复杂建筑规范符合性检测装置和方法
CN112784345A (zh) * 2021-02-07 2021-05-11 殿汇空间(上海)信息科技有限公司 基于知识图谱的图模一致性审查方法、系统、终端及介质
CN113868433A (zh) * 2021-09-24 2021-12-31 联想(北京)有限公司 数据处理方法、装置及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897364A (zh) * 2017-01-12 2017-06-27 上海大学 基于事件的中文指代语料库构建方法
CN107341598A (zh) * 2017-06-23 2017-11-10 清华大学 语义和几何计算结合的复杂建筑规范符合性检测装置和方法
CN112784345A (zh) * 2021-02-07 2021-05-11 殿汇空间(上海)信息科技有限公司 基于知识图谱的图模一致性审查方法、系统、终端及介质
CN113868433A (zh) * 2021-09-24 2021-12-31 联想(北京)有限公司 数据处理方法、装置及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
自然资源部办公厅: "自然资源部办公厅关于印发新型基础测绘与实景三维中国建设技术文件(5-7)的通知", 《自然资源通讯》, no. 8, 11 May 2023 (2023-05-11), pages 41 - 48 *

Similar Documents

Publication Publication Date Title
Rahimian et al. On-demand monitoring of construction projects through a game-like hybrid application of BIM and machine learning
US20210311968A1 (en) Dynamic clustering for streaming data
KR102123450B1 (ko) Bim 데이터를 이용한 건축 공사 시방서 생성 방법, 이를 수행하기 위한 기록매체 및 시스템
US20190294986A1 (en) Presenting inference models based on interrelationships
US20140164072A1 (en) System and Method for Quantified Quality Analysis and Benchmarking for Building Information Modeling
CN114116065B (zh) 获取拓扑图数据对象的方法、装置、及电子设备
Masoumi et al. City Digital Twins: their maturity level and differentiation from 3D city models
CN110991553B (zh) Bim模型对比方法
CN115774861A (zh) 一种自然资源多源异构数据汇聚融合服务系统
CN114565548A (zh) 工业缺陷识别方法、系统、计算设备及存储介质
Guo et al. An event-driven dynamic updating method for 3D geo-databases
US11308364B1 (en) Automatic benchmarking of labeling tasks
Saleeb et al. A comparative suitability study between classification systems for BIM in heritage
CN109997123B (zh) 用于改进空间-时间数据管理的方法、系统和装置
Regnauld* et al. Creating a hydrographic network from its cartographic representation: a case study using Ordnance Survey MasterMap data
CN111340100A (zh) Bim模型的相似度计算方法
Giacobbe et al. Evaluating information quality in delivering IoT-as-a-service
Wong et al. Using geometry-based metrics as part of fitness-for-purpose evaluations of 3D city models
CN112417023A (zh) 处理ifc文件的方法、装置、电子设备、存储介质和程序产品
CN117391088A (zh) 一种语义一致性检查方法及装置
CN114639044A (zh) 标签确定方法、装置、电子设备及存储介质
CN113688299A (zh) 地块选择方法、装置、电子设备及存储介质
CN113434713B (zh) 一种基于一张图的林业大数据建设方法及系统
Krumm et al. Spatial Gems, Volume 1
CN117763689B (zh) 一种应用cad和bim数据联动分析的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination