CN104933205A - 土地利用空间数据处理中基于地理本体的属性匹配方法 - Google Patents
土地利用空间数据处理中基于地理本体的属性匹配方法 Download PDFInfo
- Publication number
- CN104933205A CN104933205A CN201510417505.2A CN201510417505A CN104933205A CN 104933205 A CN104933205 A CN 104933205A CN 201510417505 A CN201510417505 A CN 201510417505A CN 104933205 A CN104933205 A CN 104933205A
- Authority
- CN
- China
- Prior art keywords
- ontology
- attribute
- elements
- similarity
- spatial data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000010276 construction Methods 0.000 claims abstract description 15
- 238000009472 formulation Methods 0.000 claims description 3
- 230000008676 import Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及土地利用空间数据处理中的同名实体属性匹配方法,具体是一种土地利用空间数据处理中基于地理本体的属性匹配方法。本发明解决了现有同名实体属性匹配方法容易造成匹配错误、适用范围受限的问题。土地利用空间数据处理中基于地理本体的属性匹配方法,该方法是采用如下步骤实现的:1)构建地理本体;所述地理本体包括本体类库、本体关系库、知识库;具体构建步骤包括:1.1)构建本体类库;所述本体类库包括土地分类、行政区划、空间坐标系、要素类型;1.2)构建本体关系库:所述本体关系库包括对象关系库、数值关系库;1.3)构建知识库;2)实体属性匹配。本发明适用于土地利用空间数据处理。
Description
技术领域
本发明涉及土地利用空间数据处理中的同名实体属性匹配方法,具体是一种土地利用空间数据处理中基于地理本体的属性匹配方法。
背景技术
在土地利用空间数据处理中,同名实体的属性匹配是一道十分重要的环节。在现有技术条件下,同名实体的属性匹配普遍采用字符串匹配方法。字符串匹配方法是指从文本中找出给定字符串的一个或所有出现的位置,然后通过简单的叠加查询到包含部分关键字符串的文档。实践表明,字符串匹配方法由于自身原理所限,存在如下问题:其一,字符串匹配方法无法理解推理出查询的语义,由此容易造成匹配错误。其二,字符串匹配方法无法满足不同应用系统之间互操作的需求,由此导致适用范围受限。本发明是一种全新的同名实体属性匹配方法,以改进现有同名实体属性匹配方法容易造成匹配错误、适用范围受限的问题。
发明内容
本发明为了解决现有同名实体属性匹配方法容易造成匹配错误、适用范围受限的问题,提供了一种土地利用空间数据处理中基于地理本体的属性匹配方法。
本发明是采用如下技术方案实现的:土地利用空间数据处理中基于地理本体的属性匹配方法,该方法是采用如下步骤实现的:
1)构建地理本体;所述地理本体包括本体类库、本体关系库、知识库;具体构建步骤包括:
1.1)构建本体类库;所述本体类库包括土地分类、行政区划、空间坐标系、要素类型;具体构建步骤包括:
1.1.1)构建土地分类;
1.1.2)构建行政区划;
1.1.3)构建空间坐标系;
1.1.4)构建要素类型;
1.2)构建本体关系库:所述本体关系库包括对象关系库、数值关系库;具体构建步骤包括:
1.2.1)构建对象关系库;
1.2.2)构建数值关系库;
1.3)构建知识库;
2)实体属性匹配;具体匹配步骤包括:
2.1)将空间数据导入地理本体;
2.2)首先,对空间数据中的两要素的各个数字型属性进行相似度计算;具体计算公式如下:
式(1)中:D为两要素的同一个数字型属性的相似度;A1、A2分别为两要素的同一个数字型属性的取值;
然后,对两要素的各个数字型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则采用向量来表示空间数据中的两要素的各个字符型属性,并对空间数据中的两要素的各个字符型属性进行相似度计算;具体表示公式和计算公式如下:
A1=(w1,1,w2,1,...,wn,1) (2);
A2=(w1,2,w2,2,...,wn,2) (3);
式(2)-(4)中:A1、A2分别为两要素的同一个字符型属性的向量表示;w1,w2,…,wn分别为独立的词组;cosθ为两要素的同一个字符型属性的相似度;A1·A2为两要素的同一个字符型属性的向量表示的点乘;||A1||、||A2||分别为两要素的同一个字符型属性的向量表示的模;
最后,对两要素的各个字符型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则将两要素判定为同一实体,由此完成实体属性匹配。
与现有同名实体属性匹配方法相比,本发明所述的土地利用空间数据处理中基于地理本体的属性匹配方法通过将本体技术引入到同名实体的属性匹配中,一方面实现了理解推理出查询的语义,由此有效防止了匹配错误,另一方面满足了不同应用系统之间互操作的需求,由此使得适用范围不再受限。
本发明有效解决了现有同名实体属性匹配方法容易造成匹配错误、适用范围受限的问题,适用于土地利用空间数据处理。
附图说明
图1是本发明的步骤1.1)的示意图。
图2是本发明的步骤1.1.1)的示意图。
图3是本发明的步骤1.2.1)的示意图。
图4是本发明的步骤2)的示意图。
具体实施方式
土地利用空间数据处理中基于地理本体的属性匹配方法,该方法是采用如下步骤实现的:
1)构建地理本体;所述地理本体包括本体类库、本体关系库、知识库;具体构建步骤包括:
1.1)构建本体类库;所述本体类库包括土地分类、行政区划、空间坐标系、要素类型;具体构建步骤包括:
1.1.1)构建土地分类;
1.1.2)构建行政区划;
1.1.3)构建空间坐标系;
1.1.4)构建要素类型;
1.2)构建本体关系库:所述本体关系库包括对象关系库、数值关系库;具体构建步骤包括:
1.2.1)构建对象关系库;
1.2.2)构建数值关系库;
1.3)构建知识库;
2)实体属性匹配;具体匹配步骤包括:
2.1)将空间数据导入地理本体;
2.2)首先,对空间数据中的两要素的各个数字型属性进行相似度计算;具体计算公式如下:
式(1)中:D为两要素的同一个数字型属性的相似度;A1、A2分别为两要素的同一个数字型属性的取值;
然后,对两要素的各个数字型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则采用向量来表示空间数据中的两要素的各个字符型属性,并对空间数据中的两要素的各个字符型属性进行相似度计算;具体表示公式和计算公式如下:
A1=(w1,1,w2,1,...,wn,1) (2);
A2=(w1,2,w2,2,...,wn,2) (3);
式(2)-(4)中:A1、A2分别为两要素的同一个字符型属性的向量表示;w1,w2,…,wn分别为独立的词组;cosθ为两要素的同一个字符型属性的相似度;A1·A2为两要素的同一个字符型属性的向量表示的点乘;||A1||、||A2||分别为两要素的同一个字符型属性的向量表示的模;
最后,对两要素的各个字符型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则将两要素判定为同一实体,由此完成实体属性匹配。
所述步骤1.1.1)中,构建土地分类是以全国土地分类标准为标准,土地分类的一级目录的类为父类,土地分类的二级目录的类为一级目录的子类,土地分类的三级目录的类为二级目录的子类;
所述步骤1.1.2)中,构建行政区划是以国家规定的行政区划为标准,行政区划的一级目录的类为父类,行政区划的二级目录的类为一级目录的子类,行政区划的三级目录的类为二级目录的子类;
所述步骤1.1.3)中,构建空间坐标系是以现有的空间坐标系种类为标准;
所述步骤1.1.4)中,构建要素类型是以要素在图幅中的表现形式为标准,要素类型分为点、线、面三类;
所述步骤1.2.1)中,构建对象关系库是以空间数据具有的拓扑关系、方位关系、距离关系为标准;
所述步骤1.2.2)中,构建数值关系库是以国家测绘标准为标准;
所述步骤1.3)中,构建知识库是以国家标准以及空间数据实际情况构建本体规则,并将本体规则组成知识库。
所述步骤2.2)中,对两要素的各个数字型属性的相似度进行加权的具体加权公式如下:
P=ΣKi*pi (5);
ΣKi=1 (6);
式(5)-(6)中:P为两要素的各个数字型属性的相似度的加权值;Ki为两要素的各个数字型属性的相似度的权重值;pi为两要素的各个数字型属性的相似度;
所述步骤2.2)中,对两要素的各个字符型属性的相似度进行加权的具体加权公式如下:
P=ΣKi*pi (7);
ΣKi=1 (8);
式(7)-(8)中:P为两要素的各个字符型属性的相似度的加权值;Ki为两要素的各个字符型属性的相似度的权重值;pi为两要素的各个字符型属性的相似度。
Claims (3)
1.一种土地利用空间数据处理中基于地理本体的属性匹配方法,其特征在于:该方法是采用如下步骤实现的:
1)构建地理本体;所述地理本体包括本体类库、本体关系库、知识库;具体构建步骤包括:
1.1)构建本体类库;所述本体类库包括土地分类、行政区划、空间坐标系、要素类型;具体构建步骤包括:
1.1.1)构建土地分类;
1.1.2)构建行政区划;
1.1.3)构建空间坐标系;
1.1.4)构建要素类型;
1.2)构建本体关系库:所述本体关系库包括对象关系库、数值关系库;具体构建步骤包括:
1.2.1)构建对象关系库;
1.2.2)构建数值关系库;
1.3)构建知识库;
2)实体属性匹配;具体匹配步骤包括:
2.1)将空间数据导入地理本体;
2.2)首先,对空间数据中的两要素的各个数字型属性进行相似度计算;具体计算公式如下:
式(1)中:D为两要素的同一个数字型属性的相似度;A1、A2分别为两要素的同一个数字型属性的取值;
然后,对两要素的各个数字型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则采用向量来表示空间数据中的两要素的各个字符型属性,并对空间数据中的两要素的各个字符型属性进行相似度计算;具体表示公式和计算公式如下:
A1=(w1,1,w2,1,...,wn,1) (2);
A2=(w1,2,w2,2,...,wn,2) (3);
式(2)-(4)中:A1、A2分别为两要素的同一个字符型属性的向量表示;w1,w2,…,wn分别为独立的词组;cosθ为两要素的同一个字符型属性的相似度;A1·A2为两要素的同一个字符型属性的向量表示的点乘;||A1||、||A2||分别为两要素的同一个字符型属性的向量表示的模;
最后,对两要素的各个字符型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则将两要素判定为同一实体,由此完成实体属性匹配。
2.根据权利要求1所述的土地利用空间数据处理中基于地理本体的属性匹配方法,其特征在于:
所述步骤1.1.1)中,构建土地分类是以全国土地分类标准为标准,土地分类的一级目录的类为父类,土地分类的二级目录的类为一级目录的子类,土地分类的三级目录的类为二级目录的子类;
所述步骤1.1.2)中,构建行政区划是以国家规定的行政区划为标准,行政区划的一级目录的类为父类,行政区划的二级目录的类为一级目录的子类,行政区划的三级目录的类为二级目录的子类;
所述步骤1.1.3)中,构建空间坐标系是以现有的空间坐标系种类为标准;
所述步骤1.1.4)中,构建要素类型是以要素在图幅中的表现形式为标准,要素类型分为点、线、面三类;
所述步骤1.2.1)中,构建对象关系库是以空间数据具有的拓扑关系、方位关系、距离关系为标准;
所述步骤1.2.2)中,构建数值关系库是以国家测绘标准为标准;
所述步骤1.3)中,构建知识库是以国家标准以及空间数据实际情况构建本体规则,并将本体规则组成知识库。
3.根据权利要求1所述的土地利用空间数据处理中基于地理本体的属性匹配方法,其特征在于:
所述步骤2.2)中,对两要素的各个数字型属性的相似度进行加权的具体加权公式如下:
P=ΣKi*pi (5);
ΣKi=1 (6);
式(5)-(6)中:P为两要素的各个数字型属性的相似度的加权值;Ki为两要素的各个数字型属性的相似度的权重值;pi为两要素的各个数字型属性的相似度;
所述步骤2.2)中,对两要素的各个字符型属性的相似度进行加权的具体加权公式如下:
P=ΣKi*pi (7);
ΣKi=1 (8);
式(7)-(8)中:P为两要素的各个字符型属性的相似度的加权值;Ki为两要素的各个字符型属性的相似度的权重值;pi为两要素的各个字符型属性的相似度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510417505.2A CN104933205A (zh) | 2015-07-15 | 2015-07-15 | 土地利用空间数据处理中基于地理本体的属性匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510417505.2A CN104933205A (zh) | 2015-07-15 | 2015-07-15 | 土地利用空间数据处理中基于地理本体的属性匹配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104933205A true CN104933205A (zh) | 2015-09-23 |
Family
ID=54120372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510417505.2A Pending CN104933205A (zh) | 2015-07-15 | 2015-07-15 | 土地利用空间数据处理中基于地理本体的属性匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104933205A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335478A (zh) * | 2015-10-10 | 2016-02-17 | 深圳市数字城市工程研究中心 | 构建城市土地空间立体调查数据语义关联的方法和装置 |
CN108763221A (zh) * | 2018-06-20 | 2018-11-06 | 科大讯飞股份有限公司 | 一种属性名表征方法及装置 |
CN109165195A (zh) * | 2018-08-01 | 2019-01-08 | 山东省国土测绘院 | 一种测绘成果目录多元转换系统及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130091458A1 (en) * | 2011-10-05 | 2013-04-11 | Kia Motors Corporation | Album list management system and method in mobile device |
CN104536957A (zh) * | 2014-09-26 | 2015-04-22 | 北京师范大学 | 农用土地流转信息检索方法和系统 |
-
2015
- 2015-07-15 CN CN201510417505.2A patent/CN104933205A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130091458A1 (en) * | 2011-10-05 | 2013-04-11 | Kia Motors Corporation | Album list management system and method in mobile device |
CN104536957A (zh) * | 2014-09-26 | 2015-04-22 | 北京师范大学 | 农用土地流转信息检索方法和系统 |
Non-Patent Citations (2)
Title |
---|
李建洁 等: "基于本体规则的接边数据一致性维护", 《科学技术与工程》 * |
郭小菊: "基于地理本体的同名实体匹配技术研究", 《中国优秀硕士学位论文全文数据库基础科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335478A (zh) * | 2015-10-10 | 2016-02-17 | 深圳市数字城市工程研究中心 | 构建城市土地空间立体调查数据语义关联的方法和装置 |
CN108763221A (zh) * | 2018-06-20 | 2018-11-06 | 科大讯飞股份有限公司 | 一种属性名表征方法及装置 |
CN108763221B (zh) * | 2018-06-20 | 2022-05-17 | 科大讯飞股份有限公司 | 一种属性名表征方法及装置 |
CN109165195A (zh) * | 2018-08-01 | 2019-01-08 | 山东省国土测绘院 | 一种测绘成果目录多元转换系统及方法 |
CN109165195B (zh) * | 2018-08-01 | 2020-12-04 | 山东省国土测绘院 | 一种测绘成果目录多元转换系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104699818B (zh) | 一种多源异构的多属性poi融合方法 | |
KR101525529B1 (ko) | 데이터 처리장치 및 그 데이터 매핑방법 | |
Mu et al. | Estimation and inference in spatially varying coefficient models | |
Safra et al. | Ad hoc matching of vectorial road networks | |
CN103473409B (zh) | 一种基于知识库的fpga故障自动诊断方法 | |
US11886961B2 (en) | Preparing data for machine learning processing | |
CN102347917A (zh) | 用于网络消息通信的联系人语义分组方法 | |
CN107145523A (zh) | 基于迭代匹配的大型异构知识库对齐方法 | |
Regalia et al. | Computing and querying strict, approximate, and metrically refined topological relations in linked geographic data | |
CN107895038A (zh) | 一种链路预测关系推荐方法及装置 | |
CN103577442A (zh) | 一种地图数据重要度计算方法及装置 | |
Jiang et al. | Interactive analysis of epidemic situations based on a spatiotemporal information knowledge graph of COVID-19 | |
CN104102699B (zh) | 一种聚簇图集合中的子图检索方法 | |
Bimonte et al. | Spatial olap and map generalization: Model and algebra | |
US8228326B2 (en) | Three dimensional surface and solid query processing | |
CN104933205A (zh) | 土地利用空间数据处理中基于地理本体的属性匹配方法 | |
You et al. | Eulerian methods for visualizing continuous dynamical systems using Lyapunov exponents | |
CN107645493B (zh) | 一种ip组相似度计算方法 | |
CN110019634A (zh) | 定量精准的地理空间数据关联方法和装置 | |
CN103390058B (zh) | 基于知识地图的领域知识浏览方法 | |
Cho et al. | A GPS trajectory map-matching mechanism with DTG big data on the HBase system | |
Corcoran et al. | Spatial relations using high level concepts | |
US10706049B2 (en) | Method and apparatus for querying nondeterministic graph | |
Salleh et al. | Representing 3D topological adjacencies between volumes using a 36-intersection model | |
Wu et al. | Urban parcel grouping method based on urban form and functional connectivity characterisation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150923 |
|
RJ01 | Rejection of invention patent application after publication |