CN104933205A - 土地利用空间数据处理中基于地理本体的属性匹配方法 - Google Patents
土地利用空间数据处理中基于地理本体的属性匹配方法 Download PDFInfo
- Publication number
- CN104933205A CN104933205A CN201510417505.2A CN201510417505A CN104933205A CN 104933205 A CN104933205 A CN 104933205A CN 201510417505 A CN201510417505 A CN 201510417505A CN 104933205 A CN104933205 A CN 104933205A
- Authority
- CN
- China
- Prior art keywords
- key elements
- ontology
- type attribute
- similarity
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及土地利用空间数据处理中的同名实体属性匹配方法,具体是一种土地利用空间数据处理中基于地理本体的属性匹配方法。本发明解决了现有同名实体属性匹配方法容易造成匹配错误、适用范围受限的问题。土地利用空间数据处理中基于地理本体的属性匹配方法,该方法是采用如下步骤实现的:1)构建地理本体;所述地理本体包括本体类库、本体关系库、知识库;具体构建步骤包括:1.1)构建本体类库;所述本体类库包括土地分类、行政区划、空间坐标系、要素类型;1.2)构建本体关系库:所述本体关系库包括对象关系库、数值关系库;1.3)构建知识库;2)实体属性匹配。本发明适用于土地利用空间数据处理。
Description
技术领域
本发明涉及土地利用空间数据处理中的同名实体属性匹配方法,具体是一种土地利用空间数据处理中基于地理本体的属性匹配方法。
背景技术
在土地利用空间数据处理中,同名实体的属性匹配是一道十分重要的环节。在现有技术条件下,同名实体的属性匹配普遍采用字符串匹配方法。字符串匹配方法是指从文本中找出给定字符串的一个或所有出现的位置,然后通过简单的叠加查询到包含部分关键字符串的文档。实践表明,字符串匹配方法由于自身原理所限,存在如下问题:其一,字符串匹配方法无法理解推理出查询的语义,由此容易造成匹配错误。其二,字符串匹配方法无法满足不同应用系统之间互操作的需求,由此导致适用范围受限。本发明是一种全新的同名实体属性匹配方法,以改进现有同名实体属性匹配方法容易造成匹配错误、适用范围受限的问题。
发明内容
本发明为了解决现有同名实体属性匹配方法容易造成匹配错误、适用范围受限的问题,提供了一种土地利用空间数据处理中基于地理本体的属性匹配方法。
本发明是采用如下技术方案实现的:土地利用空间数据处理中基于地理本体的属性匹配方法,该方法是采用如下步骤实现的:
1)构建地理本体;所述地理本体包括本体类库、本体关系库、知识库;具体构建步骤包括:
1.1)构建本体类库;所述本体类库包括土地分类、行政区划、空间坐标系、要素类型;具体构建步骤包括:
1.1.1)构建土地分类;
1.1.2)构建行政区划;
1.1.3)构建空间坐标系;
1.1.4)构建要素类型;
1.2)构建本体关系库:所述本体关系库包括对象关系库、数值关系库;具体构建步骤包括:
1.2.1)构建对象关系库;
1.2.2)构建数值关系库;
1.3)构建知识库;
2)实体属性匹配;具体匹配步骤包括:
2.1)将空间数据导入地理本体;
2.2)首先,对空间数据中的两要素的各个数字型属性进行相似度计算;具体计算公式如下:
式(1)中:D为两要素的同一个数字型属性的相似度;A1、A2分别为两要素的同一个数字型属性的取值;
然后,对两要素的各个数字型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则采用向量来表示空间数据中的两要素的各个字符型属性,并对空间数据中的两要素的各个字符型属性进行相似度计算;具体表示公式和计算公式如下:
A1=(w1,1,w2,1,...,wn,1) (2);
A2=(w1,2,w2,2,...,wn,2) (3);
式(2)-(4)中:A1、A2分别为两要素的同一个字符型属性的向量表示;w1,w2,…,wn分别为独立的词组;cosθ为两要素的同一个字符型属性的相似度;A1·A2为两要素的同一个字符型属性的向量表示的点乘;||A1||、||A2||分别为两要素的同一个字符型属性的向量表示的模;
最后,对两要素的各个字符型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则将两要素判定为同一实体,由此完成实体属性匹配。
与现有同名实体属性匹配方法相比,本发明所述的土地利用空间数据处理中基于地理本体的属性匹配方法通过将本体技术引入到同名实体的属性匹配中,一方面实现了理解推理出查询的语义,由此有效防止了匹配错误,另一方面满足了不同应用系统之间互操作的需求,由此使得适用范围不再受限。
本发明有效解决了现有同名实体属性匹配方法容易造成匹配错误、适用范围受限的问题,适用于土地利用空间数据处理。
附图说明
图1是本发明的步骤1.1)的示意图。
图2是本发明的步骤1.1.1)的示意图。
图3是本发明的步骤1.2.1)的示意图。
图4是本发明的步骤2)的示意图。
具体实施方式
土地利用空间数据处理中基于地理本体的属性匹配方法,该方法是采用如下步骤实现的:
1)构建地理本体;所述地理本体包括本体类库、本体关系库、知识库;具体构建步骤包括:
1.1)构建本体类库;所述本体类库包括土地分类、行政区划、空间坐标系、要素类型;具体构建步骤包括:
1.1.1)构建土地分类;
1.1.2)构建行政区划;
1.1.3)构建空间坐标系;
1.1.4)构建要素类型;
1.2)构建本体关系库:所述本体关系库包括对象关系库、数值关系库;具体构建步骤包括:
1.2.1)构建对象关系库;
1.2.2)构建数值关系库;
1.3)构建知识库;
2)实体属性匹配;具体匹配步骤包括:
2.1)将空间数据导入地理本体;
2.2)首先,对空间数据中的两要素的各个数字型属性进行相似度计算;具体计算公式如下:
式(1)中:D为两要素的同一个数字型属性的相似度;A1、A2分别为两要素的同一个数字型属性的取值;
然后,对两要素的各个数字型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则采用向量来表示空间数据中的两要素的各个字符型属性,并对空间数据中的两要素的各个字符型属性进行相似度计算;具体表示公式和计算公式如下:
A1=(w1,1,w2,1,...,wn,1) (2);
A2=(w1,2,w2,2,...,wn,2) (3);
式(2)-(4)中:A1、A2分别为两要素的同一个字符型属性的向量表示;w1,w2,…,wn分别为独立的词组;cosθ为两要素的同一个字符型属性的相似度;A1·A2为两要素的同一个字符型属性的向量表示的点乘;||A1||、||A2||分别为两要素的同一个字符型属性的向量表示的模;
最后,对两要素的各个字符型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则将两要素判定为同一实体,由此完成实体属性匹配。
所述步骤1.1.1)中,构建土地分类是以全国土地分类标准为标准,土地分类的一级目录的类为父类,土地分类的二级目录的类为一级目录的子类,土地分类的三级目录的类为二级目录的子类;
所述步骤1.1.2)中,构建行政区划是以国家规定的行政区划为标准,行政区划的一级目录的类为父类,行政区划的二级目录的类为一级目录的子类,行政区划的三级目录的类为二级目录的子类;
所述步骤1.1.3)中,构建空间坐标系是以现有的空间坐标系种类为标准;
所述步骤1.1.4)中,构建要素类型是以要素在图幅中的表现形式为标准,要素类型分为点、线、面三类;
所述步骤1.2.1)中,构建对象关系库是以空间数据具有的拓扑关系、方位关系、距离关系为标准;
所述步骤1.2.2)中,构建数值关系库是以国家测绘标准为标准;
所述步骤1.3)中,构建知识库是以国家标准以及空间数据实际情况构建本体规则,并将本体规则组成知识库。
所述步骤2.2)中,对两要素的各个数字型属性的相似度进行加权的具体加权公式如下:
P=ΣKi*pi (5);
ΣKi=1 (6);
式(5)-(6)中:P为两要素的各个数字型属性的相似度的加权值;Ki为两要素的各个数字型属性的相似度的权重值;pi为两要素的各个数字型属性的相似度;
所述步骤2.2)中,对两要素的各个字符型属性的相似度进行加权的具体加权公式如下:
P=ΣKi*pi (7);
ΣKi=1 (8);
式(7)-(8)中:P为两要素的各个字符型属性的相似度的加权值;Ki为两要素的各个字符型属性的相似度的权重值;pi为两要素的各个字符型属性的相似度。
Claims (3)
1.一种土地利用空间数据处理中基于地理本体的属性匹配方法,其特征在于:该方法是采用如下步骤实现的:
1)构建地理本体;所述地理本体包括本体类库、本体关系库、知识库;具体构建步骤包括:
1.1)构建本体类库;所述本体类库包括土地分类、行政区划、空间坐标系、要素类型;具体构建步骤包括:
1.1.1)构建土地分类;
1.1.2)构建行政区划;
1.1.3)构建空间坐标系;
1.1.4)构建要素类型;
1.2)构建本体关系库:所述本体关系库包括对象关系库、数值关系库;具体构建步骤包括:
1.2.1)构建对象关系库;
1.2.2)构建数值关系库;
1.3)构建知识库;
2)实体属性匹配;具体匹配步骤包括:
2.1)将空间数据导入地理本体;
2.2)首先,对空间数据中的两要素的各个数字型属性进行相似度计算;具体计算公式如下:
式(1)中:D为两要素的同一个数字型属性的相似度;A1、A2分别为两要素的同一个数字型属性的取值;
然后,对两要素的各个数字型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则采用向量来表示空间数据中的两要素的各个字符型属性,并对空间数据中的两要素的各个字符型属性进行相似度计算;具体表示公式和计算公式如下:
A1=(w1,1,w2,1,...,wn,1) (2);
A2=(w1,2,w2,2,...,wn,2) (3);
式(2)-(4)中:A1、A2分别为两要素的同一个字符型属性的向量表示;w1,w2,…,wn分别为独立的词组;cosθ为两要素的同一个字符型属性的相似度;A1·A2为两要素的同一个字符型属性的向量表示的点乘;||A1||、||A2||分别为两要素的同一个字符型属性的向量表示的模;
最后,对两要素的各个字符型属性的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则结束匹配;若加权值大于阈值,则将两要素判定为同一实体,由此完成实体属性匹配。
2.根据权利要求1所述的土地利用空间数据处理中基于地理本体的属性匹配方法,其特征在于:
所述步骤1.1.1)中,构建土地分类是以全国土地分类标准为标准,土地分类的一级目录的类为父类,土地分类的二级目录的类为一级目录的子类,土地分类的三级目录的类为二级目录的子类;
所述步骤1.1.2)中,构建行政区划是以国家规定的行政区划为标准,行政区划的一级目录的类为父类,行政区划的二级目录的类为一级目录的子类,行政区划的三级目录的类为二级目录的子类;
所述步骤1.1.3)中,构建空间坐标系是以现有的空间坐标系种类为标准;
所述步骤1.1.4)中,构建要素类型是以要素在图幅中的表现形式为标准,要素类型分为点、线、面三类;
所述步骤1.2.1)中,构建对象关系库是以空间数据具有的拓扑关系、方位关系、距离关系为标准;
所述步骤1.2.2)中,构建数值关系库是以国家测绘标准为标准;
所述步骤1.3)中,构建知识库是以国家标准以及空间数据实际情况构建本体规则,并将本体规则组成知识库。
3.根据权利要求1所述的土地利用空间数据处理中基于地理本体的属性匹配方法,其特征在于:
所述步骤2.2)中,对两要素的各个数字型属性的相似度进行加权的具体加权公式如下:
P=ΣKi*pi (5);
ΣKi=1 (6);
式(5)-(6)中:P为两要素的各个数字型属性的相似度的加权值;Ki为两要素的各个数字型属性的相似度的权重值;pi为两要素的各个数字型属性的相似度;
所述步骤2.2)中,对两要素的各个字符型属性的相似度进行加权的具体加权公式如下:
P=ΣKi*pi (7);
ΣKi=1 (8);
式(7)-(8)中:P为两要素的各个字符型属性的相似度的加权值;Ki为两要素的各个字符型属性的相似度的权重值;pi为两要素的各个字符型属性的相似度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510417505.2A CN104933205A (zh) | 2015-07-15 | 2015-07-15 | 土地利用空间数据处理中基于地理本体的属性匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510417505.2A CN104933205A (zh) | 2015-07-15 | 2015-07-15 | 土地利用空间数据处理中基于地理本体的属性匹配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104933205A true CN104933205A (zh) | 2015-09-23 |
Family
ID=54120372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510417505.2A Pending CN104933205A (zh) | 2015-07-15 | 2015-07-15 | 土地利用空间数据处理中基于地理本体的属性匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104933205A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335478A (zh) * | 2015-10-10 | 2016-02-17 | 深圳市数字城市工程研究中心 | 构建城市土地空间立体调查数据语义关联的方法和装置 |
CN108763221A (zh) * | 2018-06-20 | 2018-11-06 | 科大讯飞股份有限公司 | 一种属性名表征方法及装置 |
CN109165195A (zh) * | 2018-08-01 | 2019-01-08 | 山东省国土测绘院 | 一种测绘成果目录多元转换系统及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130091458A1 (en) * | 2011-10-05 | 2013-04-11 | Kia Motors Corporation | Album list management system and method in mobile device |
CN104536957A (zh) * | 2014-09-26 | 2015-04-22 | 北京师范大学 | 农用土地流转信息检索方法和系统 |
-
2015
- 2015-07-15 CN CN201510417505.2A patent/CN104933205A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130091458A1 (en) * | 2011-10-05 | 2013-04-11 | Kia Motors Corporation | Album list management system and method in mobile device |
CN104536957A (zh) * | 2014-09-26 | 2015-04-22 | 北京师范大学 | 农用土地流转信息检索方法和系统 |
Non-Patent Citations (2)
Title |
---|
李建洁 等: "基于本体规则的接边数据一致性维护", 《科学技术与工程》 * |
郭小菊: "基于地理本体的同名实体匹配技术研究", 《中国优秀硕士学位论文全文数据库基础科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335478A (zh) * | 2015-10-10 | 2016-02-17 | 深圳市数字城市工程研究中心 | 构建城市土地空间立体调查数据语义关联的方法和装置 |
CN108763221A (zh) * | 2018-06-20 | 2018-11-06 | 科大讯飞股份有限公司 | 一种属性名表征方法及装置 |
CN108763221B (zh) * | 2018-06-20 | 2022-05-17 | 科大讯飞股份有限公司 | 一种属性名表征方法及装置 |
CN109165195A (zh) * | 2018-08-01 | 2019-01-08 | 山东省国土测绘院 | 一种测绘成果目录多元转换系统及方法 |
CN109165195B (zh) * | 2018-08-01 | 2020-12-04 | 山东省国土测绘院 | 一种测绘成果目录多元转换系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | Rigid formation shape control in general dimensions: an invariance principle and open problems | |
CN107480191A (zh) | 一种迭代的实体对齐模型 | |
CN105976604A (zh) | 一种基于gis和公交gps数据的公交线路匹配方法 | |
CN105279187A (zh) | 一种基于边聚集系数的社会网络群体划分方法 | |
Kalabušić et al. | Dynamics of a two-dimensional system of rational difference equations of Leslie--Gower type | |
Liu et al. | A combined approach to cartographic displacement for buildings based on skeleton and improved elastic beam algorithm | |
CN104933205A (zh) | 土地利用空间数据处理中基于地理本体的属性匹配方法 | |
CN104318304A (zh) | 一种用于模式识别的基于样本学习的bp网络结构设计方法 | |
CN104517106A (zh) | 一种列表识别方法与系统 | |
CN101882150B (zh) | 一种基于核密度估计的三维模型比较和检索方法 | |
CN104182748A (zh) | 一种基于拆分匹配的汉字笔画自动提取方法 | |
CN107145523A (zh) | 基于迭代匹配的大型异构知识库对齐方法 | |
NZ756872A (en) | Property graph data model representing system architecture | |
CN103123685B (zh) | 文本模式识别方法 | |
CN106055652A (zh) | 一种基于模式和实例的数据库匹配方法及系统 | |
You et al. | Eulerian methods for visualizing continuous dynamical systems using Lyapunov exponents | |
Jia et al. | An advanced distributed MDS-MAP localization algorithm with improved merging strategy | |
Dobrynin | Infinite family of 2-connected transmission irregular graphs | |
CN103049593A (zh) | 一种计算两条参数曲线间的Hausdorff距离的方法 | |
CN102663108A (zh) | 基于复杂网络模型并行化标签传播算法的药物社团发现方法 | |
Lu et al. | Coexisting singular cycles in a class of three-dimensional three-zone piecewise affine systems. | |
Hadžiabdić et al. | Dynamics of a two-dimensional competitive system of rational difference equations with quadratic terms | |
Zhuo et al. | A system of integral equations on half space | |
Miron | Lagrangian and Hamiltonian geometries. Applications to analytical mechanics | |
Andersson et al. | Uniform regularity close to cross singularities in an unstable free boundary problem |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150923 |