CN116932680A - 矢量空间数据的特征标记方法、系统及计算机存储介质 - Google Patents
矢量空间数据的特征标记方法、系统及计算机存储介质 Download PDFInfo
- Publication number
- CN116932680A CN116932680A CN202310985809.3A CN202310985809A CN116932680A CN 116932680 A CN116932680 A CN 116932680A CN 202310985809 A CN202310985809 A CN 202310985809A CN 116932680 A CN116932680 A CN 116932680A
- Authority
- CN
- China
- Prior art keywords
- space
- layer
- word
- index
- index value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 239000003550 marker Substances 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract description 3
- 230000006978 adaptation Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明公开一种矢量空间数据的特征标记方法、系统及计算机存储介质,包括如下步骤:步骤S1:从空间数据库中获取矢量空间要素;步骤S2:将所述矢量空间要素的属性信息作为属性文本信息,计算所述属性文本信息中所含特征词的词频和重要程度获得单个矢量空间要素的文本特征指数值;步骤S3:将矢量空间要素的几何图形作为几何图形对象,计算空间数据库中几何图形对象的出现频率和重要程度来获得单个矢量空间要素的图形特征指数值;步骤S4:基于所述文本特征指数值和所述图形特征指数值,计算各图层中每个空间要素的标记特征指数值,得到各图层的图属异质性特征标记元对象。本发明对矢量空间数据的特征标记进行量化,为矢量空间数据确权和价值评估提供支撑。
Description
技术领域
本发明涉及矢量地理空间数据的特征量化提取技术领域,具体涉及一种矢量空间数据的特征标记方法、系统及计算机存储介质。
背景技术
矢量空间数据是地理空间数据的重要组成内容,在数字城市、智慧城市等数字经济领域中发挥着支撑空间分析、计算的重要作用。而在实际应用中,目前此类数据的采集、处理、建库主要由政府主导,缺少市场化、商业化的运营开发,从而限制了这些数据的推广应用。造成这种现象的重要原因是作为一种数字商品,缺少一种成熟、科学、客观的技术方法对这类数据进行特征标记的方法和体系,使用户可以对这些数据的确权、价值评估指标进行量化提取。
发明内容
本发明的目的是针对现有技术的不足,提供一种矢量空间数据异质性特征标记方法、系统及计算机存储介质,该方法、系统及计算机存储介质能对矢量空间数据的特征标记进行量化,为矢量空间数据的确权和价值评估提供支撑。
本发明的目的之一的技术方案是:
一种矢量空间数据的特征标记方法,包括如下步骤:
步骤S1:从空间数据库中获取矢量空间要素;
步骤S2:将所述矢量空间要素的属性信息作为属性文本信息,计算所述属性文本信息中所含特征词的词频和重要程度获得单个矢量空间要素的文本特征指数值;
步骤S3:将所述矢量空间要素的几何图形作为几何图形对象,计算空间数据库中几何图形对象的出现频率和重要程度来获得单个矢量空间要素的图形特征指数值;
步骤S4:基于所述文本特征指数值和所述图形特征指数值,计算各图层中每个空间要素的标记特征指数值,得到各图层的图属异质性特征标记元对象。
进一步地,所述步骤S2:将所述矢量空间要素的属性信息作为属性文本信息,计算所述属性文本信息中所含特征词的词频和重要程度获得单个矢量空间要素的文本特征指数值,具体包括:
S201:通过分词算法得到某图层L中的词结点序列T={t1,t2,t3...,tx};
S202:基于公式计算词t的词频指数TF(t,l),nwl代表图层L中的词语个数,ntl代表词t在图层L中出现的频次;所述词频指数表示一个词t在图层L中出现次数,词频指数越高代表该词在该图层L中越重要,则含有该词的空间要素作为该图层的标记对象之一;
S203:基于公式计算词t的逆文本频率ITF(t,l),其中N为空间数据库中图层总数,LFt为词t在所有图层属性数据中出现的频次;
S204:根据图层L中词t的所述词频指数TF(t,l)和所述逆文本频率ITF(t,l),基于公式:TI(t,l,L)=TF(t,l)×ITF(t,L)计算词t的权重值θ,得到图层L中各词的权重值序列ft={θ1,θ2,θ3,…,θx},其中θi表示第i个词的文本特征指数值;所述文本特征指数值越大,代表该词在整个空间数据库越能区别于其它图层的标记关键词。
进一步地,所述步骤S3:将所述矢量空间要素的几何图形作为几何图形对象,计算空间数据库中几何图形对象的出现频率和重要程度来获得单个矢量空间要素的图形特征指数值,具体包括:
S301:以某图层L为对象,构建GeoHash网格,并统计每个GeoHash网格中所包含的实际几何图形节点数Pi,计算每个GeoHash网格的空间密度指标为其中Sum(P)表示图层L中所有几何图形的节点总数;
S302:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在图层中的空间密度指数Gpi=M1+M2+…Mn;
S303:以整个空间数据库为对象,构建GeoHash网格,计算每个GeoHash网格中所包含的实际几何图形节点数PKi,计算每个GeoHash网格的空间密度指标为其中Sum(PK)表示空间数据库中所有几何图形的节点总数;
S304:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在空间数据库中的空间密度指数其中N为空间数据库中图层总数;
S305:根据图层L中某图形的几何对象在该图层L中的空间密度指数Gpi和几何对象在空间数据库中的空间密度指数GKpi,基于公式:Geo(pi)=Gpi×GKpi计算出图形对象g的权重值β,得到图层L中各图形对象的权重值序列fg={β1,β2,β3,…,βx},其中βi表示第i个图形对象的图形特征指数值,所述图形特征指数值越大,代表该图形对象在整个空间库中越能成为区别于其它图层的标记关键图形。
进一步地,所述步骤S4:基于所述文本特征指数和所述图形特征指数,计算图层中每个空间要素的标记特征指数值,得到图层的图属异质性特征标记元对象,具体包括:
S401:统计图层L中的所有空间要素,将每个空间要素所含图形特征指数值和文本特征指数值求和得到空间要素的标记指数值Li=θi+βi,
S402:根据标记指数值得到图层L中各空间要素的标记指数值序列f={L1,L2,L3…,Lx},其中Li表示第i个空间要素的标记特征指数值;
S403:从所述标记指数值序列f中选取每个图层中指数值最大的前K个空间要素作为可代表该图层的图属异质性特征标记元对象。
本发明的目的之二的技术方案是:
一种矢量空间数据的特征标记系统,包括信息采集模块、文本特征指数模块、图形特征指数模块、标记元模块,
所述信息采集模块,用于从空间数据库中获取矢量空间要素;
所述文本特征指数模块,用于将矢量空间要素的属性信息作为文本看待,通过计算属性文本信息中所含特征词的词频和重要程度来获得单个矢量空间要素的文本特征指数值;
所述图形特征指数模块,用于将矢量空间要素的几何图形作为独立对象看待,通过计算空间数据库中几何图形对象的出现频率和重要程度来获得单个矢量空间要素的图形特征指数值;
所述标记元模块,用于基于所述文本特征指数值和所述图形特征指数值,计算图层中每个空间要素的标记指数值,从而得到图层的图属异质性特征标记元对象。
进一步地,所述文本特征指数模块,具体功能如下:
S201:通过分词算法得到图层L中的词结点序列T={t1,t2,t3...,tx};
S202:基于公式计算词t的词频指数TF(t,l),nwl代表图层L中的词语个数,ntl代表词t在图层L中出现的频次;所述词频指数表示一个词t在图层L中出现次数,词频指数越高代表该词在该图层L中越重要,则含有该词的空间要素作为该图层的标记对象之一;
S203:基于公式计算词t的逆文本频率ITF(t,l),其中N为空间数据库中图层总数,LFt为词t在所有图层属性数据中出现的频次;
S204:根据图层L中词t的所述词频指数TF(t,l)和所述逆文本频率ITF(t,l),基于公式:TI(t,l,L)=TF(t,l)×ITF(t,L)计算词t的权重值θ,得到图层L中各词的权重值序列ft={θ1,θ2,θ3,…,θx},其中θi表示第i个词的文本特征指数值;所述文本特征指数值越大,整个空间数据库越能区别于其它图层的标记关键词,将该词作为单个矢量空间要素的文本特征指数。
进一步地,所述图形特征指数模块,功能如下:
S301:以某图层L为对象,构建GeoHash网格,并统计每个GeoHash网格中所包含的实际几何图形节点数Pi,计算每个GeoHash网格的空间密度指标为其中Sum(P)表示图层L中所有几何图形的节点总数;
S302:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在图层中的空间密度指数Gpi=M1+M2+…Mn;
S303:以整个空间数据库为对象,构建GeoHash网格,计算每个GeoHash网格中所包含的实际几何图形节点数PKi,计算每个GeoHash网格的空间密度指标为其中Sum(PK)表示空间数据库中所有几何图形的节点总数;
S304:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在空间数据库中的空间密度指数其中N为空间数据库中图层总数;
S305:根据图层L中某图形的几何对象在该图层L中的空间密度指数Gpi和几何对象在空间数据库中的空间密度指数GKpi,基于公式:Geo(pi)=Gpi×GKpi计算出图形对象g的权重值β,得到图层L中各图形对象的权重值序列fg={β1,β2,β3,…,βx},其中βi表示第i个图形对象的图形特征指数值,所述图形特征指数值越大,代表该图形对象在整个空间库中越能成为区别于其它图层的标记关键图形。
进一步地,所述标记元模块,具体功能如下:
S401:统计图层L中的所有空间要素,将每个空间要素所含图形特征指数值和文本特征指数值求和得到空间要素的标记指数值Li=θi+βi,
S402:根据标记指数值得到图层L中各空间要素的标记指数值序列f={L1,L2,L3…,Lx},其中Li表示第i个空间要素的标记特征指数值;
S403:从所述标记指数值序列f中选取每个图层中指数值最大的前K个空间要素作为可代表该图层的图属异质性特征标记元对象。
本发明的目的之三的技术方案是:
一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如上述所述的矢量空间数据图属异质性特征标记方法。
采用上述技术方案具有以下有益效果:
本发明矢量空间数据的标记方法、系统及计算机存储介质基于矢量空间数据是由几何图形对象和文本属性对象组合而成的特点,计算矢量空间要素的文本特征指数值和图形特征指数值,并结合两指数得到图属异质性指标,通过提取图属异质性特征,以图属异质性指标作为标记矢量空间数据图层,实现特征标记量化,为矢量空间数据的确权和价值评估提供支撑,实现对空间数据确权登记和争议比对。故本发明实现了:
1.矢量空间数据提取了DNA信息,使得空间数据在传播使用中可以通过此DNA信息进行确权保护。
2.特征标记具有定量化描述空间矢量数据稀缺性的能力,可以客观衡量数据价值,为数据计价提供支撑。
与下面结合附图和具体实施方式作进一步的说明。
附图说明
图1为具体实施例1标记方法的流程图:
图2为具体实施例2的原理框图。
具体实施方式
具体实施例1:
参见图1所示,一种矢量空间数据的特征标记方法,包括如下步骤:
步骤S1:从空间数据库中获取矢量空间要素;该空间数据库中含有属性数据、图形图像数据、空间关系数据信息。
步骤S2:将所述矢量空间要素的属性信息作为属性文本信息,计算所述属性文本信息中所含特征词的词频和重要程度获得单个矢量空间要素的文本特征指数值;
具体包括:
S201:通过现有分词算法得到图层L中的词结点序列T={t1,t2,t3...,tx};
S202:基于公式计算词t的词频指数TF(t,l),nwl代表图层L中的词语个数,ntl代表词t在图层L中出现的频次,在空间数据库中用简单的计数统计即可得到;所述词频指数表示一个词t在图层L中出现次数,词频指数越高代表该词在该图层L中越重要,则含有该词的空间要素作为该图层的标记对象之一;
S203:基于公式计算词t的逆文本频率ITF(t,l),其中N为空间数据库中图层总数,LFt为词t在所有图层属性数据中出现的频次,在空间数据库中用简单的计数统计即可得到。
S204:根据图层L中词t的所述词频指数TF(t,l)和所述逆文本频率ITF(t,l),基于公式:TI(t,l,L)=TF(t,l)×ITF(t,L)计算词t的权重值θ,得到图层L中各词的权重值序列ft={θ1,θ2,θ3,…,θx},其中θi表示第i个词的文本特征指数值;所述文本特征指数值越大,整个空间数据库越能成为区别于其它图层的标记关键词,取最大的一个文本特征指数值作为该词单个矢量空间要素的文本特征指数值。
步骤S3:将所述矢量空间要素的几何图形作为几何图形对象,计算空间数据库中几何图形对象的出现频率和重要程度来获得单个矢量空间要素的图形特征指数值;
具体包括:
S301:以某图层L为对象,构建GeoHash网格,并统计每个GeoHash网格中所包含的实际几何图形节点数Pi,GeoHash网格中所含几何图形节点数只需比对坐标即可统计,在此基础上计算每个GeoHash网格的空间密度指标为其中Sum(P)表示图层L中所有几何图形的节点总数,该节点总数统计从GIS系统中得出。
S302:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在图层中的空间密度指数Gpi=M1+M2+…Mn;
S303:以整个空间数据库为对象,构建GeoHash网格,统计每个GeoHash网格中所包含的实际几何图形节点数PKi,在此基础上计算每个GeoHash网格的空间密度指标为其中Sum(PK)表示空间数据库中所有几何图形的节点总数,将每个图层的节点总数求和得到整个空间数据库的节点总数。
S304:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在空间数据库中的空间密度指数其中N为空间数据库中图层总数;
S305:根据图层L中某图形的几何对象在该图层L中的空间密度指数Gpi和几何对象在空间数据库中的空间密度指数GKpi,基于公式:Geo(pi)=Gpi×GKpi计算出图形对象g的权重值β,得到图层L中各图形对象的权重值序列fg={β1,β2,β3,…,βx},其中βi表示第i个图形对象的图形特征指数值,所述图形特征指数值越大,代表该图形对象在整个空间库中越能成为区别于其它图层的标记关键图形,取最大的图形特征指数值作为图形单个矢量空间要素的图形特征指数。
步骤S4:基于所述文本特征指数值和所述图形特征指数值,计算图层中每个空间要素的标记特征指数值,得到图层的图属异质性特征标记元对象;
具体包括:
S401:统计图层L中的所有空间要素,将每个空间要素所含图形特征指数和文本特征指数求和得到空间要素的标记指数Li=θi+βi,其中:Li表示图层L中第i个空间要素对象的标记指数,该标记指数由该空间要素对象的图形特征指数βi与文本特征指数θi求和得到,而βi即为S305所计算得到,θi则是从S204步骤计算得到的图层L中各词的权重序列ft中提取,提取方式是根据第i个空间要素对象所含词节点序列与ft比对,提取两者重叠词节点中的最大文本特征指数值作为该空间要素对象的文本特征指数θi。
S402:根据标记指数得到图层L中各空间要素的标记指数值序列f={L1,L2,L3…,Lx},其中Li表示第i个空间要素的标记特征指数值;
S403:从所述标记指数值序列f中选取每个图层中指数值最大的前K个空间要素作为可代表该图层的图属异质性特征标记元对象,k的取值一般根据每个图层的空间要素对象图像数量大小确定,比如可以设定为占图层空间要素总数的1%~5%取值,可根据实际应用需求灵活设置。实现了对矢量空间数据的特征标记进行量化提取。
具体实施例2:
如图2所示,一种矢量空间数据的特征标记系统,包括信息采集模块1、文本特征指数模块2、图形特征指数模块3和标记元模块4,
所述信息采集模块1,用于从空间数据库中获取矢量空间要素;
所述文本特征指数模块2,用于将矢量空间要素的属性信息作为文本看待,通过计算属性文本信息中所含特征词的词频和重要程度来获得单个矢量空间要素的文本特征指数;具体功能如下:
S201:通过分词算法得到图层L中的词结点序列T={t1,t2,t3...,tx};
S202:基于公式计算词t的词频指数TF(t,l),nwl代表图层L中的词语个数,ntl代表词t在图层L中出现的频次;所述词频指数表示一个词t在图层L中出现次数,词频指数越高代表该词在该图层L中越重要,则含有该词的空间要素作为该图层的标记对象之一;
S203:基于公式计算词t的逆文本频率ITF(t,l),其中N为空间数据库中图层总数,LFt为词t在所有图层属性数据中出现的频次;
S204:根据图层L中词t的所述词频指数TF(t,l)和所述逆文本频率ITF(t,l),基于公式:TI(t,l,L)=TF(t,l)×ITF(t,L)计算词t的权重值θ,得到图层L中各词的权重值序列ft={θ1,θ2,θ3,…,θx},其中θi表示第i个词的文本特征指数值;所述文本特征指数值越大,整个空间数据库越能成为区别于其它图层的标记关键词,将该词作为单个矢量空间要素的文本特征指数。
所述图形特征指数模块3,用于将矢量空间要素的几何图形作为独立对象看待,通过计算空间数据库中几何图形对象的出现频率和重要程度来获得单个矢量空间要素的图形特征指数;
具体功能如下:
S301:以某图层L为对象,构建GeoHash网格,并计算每个GeoHash网格中所包含的实际几何图形节点数Pi,在此基础上计算每个GeoHash网格的空间密度指标为其中Sum(P)表示图层L中所有几何图形的节点总数;
S302:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在图层中的空间密度指数Gpi=M1+M2+…Mn;
S303:以整个空间数据库为对象,构建GeoHash网格,计算每个GeoHash网格中所包含的实际几何图形节点数PKi,在此基础上计算每个GeoHash网格的空间密度指标为其中Sum(PK)表示空间数据库中所有几何图形的节点总数;
S304:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在空间数据库中的空间密度指数其中N为空间数据库中图层总数;
S305:根据图层L中某图形的几何对象在该图层L中的空间密度指数Gpi和几何对象在空间数据库中的空间密度指数GKpi,基于公式:Geo(pi)=Gpi×GKpi计算出图形对象g的权重值β,得到图层L中各图形对象的权重值序列fg={β1,β2,β3,…,βx},其中βi表示第i个图形对象的图形特征指数值,所述图形特征指数值越大,代表该图形对象在整个空间库中越能成为区别于其它图层的标记关键图形,该图形作为单个矢量空间要素的图形特征指数。
所述标记元模块4,用于基于所述文本特征指数和所述图形特征指数,计算图层中每个空间要素的标记指数,从而得到图层的图属异质性特征标记元对象;具体功能如下:
S401:统计图层L中的所有空间要素,将每个空间要素所含图形特征指数和文本特征指数求和得到空间要素的标记指数Li=θi+βi,
S402:根据标记指数得到图层L中各空间要素的标记指数值序列f={L1,L2,L3…,Lx},其中Li表示第i个空间要素的标记特征指数值;
S403:从所述标记指数值序列f中选取每个图层中指数值最大的前K个空间要素作为可代表该图层的图属异质性特征标记元对象,k的取值一般根据每个图层的空间要素对象图像数量大小确定,比如可以设定为占图层空间要素总数的1%~5%取值,可根据实际应用需求灵活设置。
具体实施例3:
一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如具体实施例1所述的矢量空间数据图属异质性特征标记方法。
本具体实施例的其它特征与具体实施例1相同,故本具体实施例在此省略。
以上对本发明所提供的技术方案进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (9)
1.一种矢量空间数据的特征标记方法,其特征在于:包括如下步骤:
步骤S1:从空间数据库中获取矢量空间要素;
步骤S2:将所述矢量空间要素的属性信息作为属性文本信息,计算所述属性文本信息中所含特征词的词频和重要程度获得单个矢量空间要素的文本特征指数值;
步骤S3:将所述矢量空间要素的几何图形作为几何图形对象,计算空间数据库中几何图形对象的出现频率和重要程度来获得单个矢量空间要素的图形特征指数值;
步骤S4:基于所述文本特征指数值和所述图形特征指数值,计算各图层中每个空间要素的标记特征指数值,得到各图层的图属异质性特征标记元对象。
2.根据权利要求1所述一种矢量空间数据的特征标记方法,其特征在于:所述步骤S2:将所述矢量空间要素的属性信息作为属性文本信息,计算所述属性文本信息中所含特征词的词频和重要程度获得单个矢量空间要素的文本特征指数值,具体包括:
S201:通过分词算法得到某图层L中的词结点序列T={t1,t2,t3...,tx};
S202:基于公式计算词t的词频指数TF(t,l),nwl代表图层L中的词语个数,ntl代表词t在图层L中出现的频次;所述词频指数表示一个词t在图层L中出现次数,词频指数越高代表该词在该图层L中越重要,则含有该词的空间要素作为该图层的标记对象之一;
S203:基于公式计算词t的逆文本频率ITF(t,l),其中N为空间数据库中图层总数,LFt为词t在所有图层属性数据中出现的频次;
S204:根据图层L中词t的所述词频指数TF(t,l)和所述逆文本频率ITF(t,l),基于公式:TI(t,l,L)=TF(t,l)×ITF(t,L)计算词t的权重值θ,得到图层L中各词的权重值序列ft={θ1,θ2,θ3,…,θx},其中θi表示第i个词的文本特征指数值;所述文本特征指数值越大,代表该词在整个空间数据库越能区别于其它图层的标记关键词。
3.根据权利要求1所述一种矢量空间数据的特征标记方法,其特征在于:所述步骤S3:将所述矢量空间要素的几何图形作为几何图形对象,计算空间数据库中几何图形对象的出现频率和重要程度来获得单个矢量空间要素的图形特征指数值,具体包括:
S301:以某图层L为对象,构建GeoHash网格,并统计每个GeoHash网格中所包含的实际几何图形节点数Pi,计算每个GeoHash网格的空间密度指标为其中Sum(P)表示图层L中所有几何图形的节点总数;
S302:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在图层中的空间密度指数Gpi=M1+M2+…Mn;
S303:以整个空间数据库为对象,构建GeoHash网格,计算每个GeoHash网格中所包含的实际几何图形节点数PKi,计算每个GeoHash网格的空间密度指标为其中Sum(PK)表示空间数据库中所有几何图形的节点总数;
S304:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在空间数据库中的空间密度指数其中N为空间数据库中图层总数;
S305:根据图层L中某图形的几何对象在该图层L中的空间密度指数Gpi和几何对象在空间数据库中的空间密度指数GKpi,基于公式:Geo(pi)=Gpi×GKpi计算出图形对象g的权重值β,得到图层L中各图形对象的权重值序列fg={β1,β2,β3,…,βx},其中βi表示第i个图形对象的图形特征指数值,所述图形特征指数值越大,代表该图形对象在整个空间库中越能成为区别于其它图层的标记关键图形。
4.根据权利要求1所述一种矢量空间数据的特征标记方法,其特征在于:所述步骤S4:基于所述文本特征指数和所述图形特征指数,计算图层中每个空间要素的标记特征指数值,得到图层的图属异质性特征标记元对象,具体包括:
S401:统计图层L中的所有空间要素,将每个空间要素所含图形特征指数值和文本特征指数值求和得到空间要素的标记指数值Li=θi+βi,
S402:根据标记指数值得到图层L中各空间要素的标记指数值序列f={L1,L2,L3…,Lx},其中Li表示第i个空间要素的标记特征指数值;
S403:从所述标记指数值序列f中选取每个图层中指数值最大的前K个空间要素作为可代表该图层的图属异质性特征标记元对象。
5.一种矢量空间数据的特征标记系统,其特征在于:包括信息采集模块、文本特征指数模块、图形特征指数模块和标记元模块,
所述信息采集模块,用于从空间数据库中获取矢量空间要素;
所述文本特征指数模块,用于将矢量空间要素的属性信息作为文本看待,通过计算属性文本信息中所含特征词的词频和重要程度来获得单个矢量空间要素的文本特征指数值;
所述图形特征指数模块,用于将矢量空间要素的几何图形作为独立对象看待,通过计算空间数据库中几何图形对象的出现频率和重要程度来获得单个矢量空间要素的图形特征指数值;
所述标记元模块,用于基于所述文本特征指数值和所述图形特征指数值,计算图层中每个空间要素的标记指数值,从而得到图层的图属异质性特征标记元对象。
6.根据权利要求5所述一种矢量空间数据的特征标记系统,其特征在于:所述文本特征指数模块,具体功能如下:
S201:通过分词算法得到图层L中的词结点序列T={t1,t2,t3...,tx};
S202:基于公式计算词t的词频指数TF(t,l),nwl代表图层L中的词语个数,ntl代表词t在图层L中出现的频次;所述词频指数表示一个词t在图层L中出现次数,词频指数越高代表该词在该图层L中越重要,则含有该词的空间要素作为该图层的标记对象之一;
S203:基于公式计算词t的逆文本频率ITF(t,l),其中N为空间数据库中图层总数,LFt为词t在所有图层属性数据中出现的频次;
S204:根据图层L中词t的所述词频指数TF(t,l)和所述逆文本频率ITF(t,l),基于公式:TI(t,l,L)=TF(t,l)×ITF(t,L)计算词t的权重值θ,得到图层L中各词的权重值序列ft={θ1,θ2,θ3,…,θx},其中θi表示第i个词的文本特征指数值;所述文本特征指数值越大,整个空间数据库越能区别于其它图层的标记关键词,将该词作为单个矢量空间要素的文本特征指数。
7.根据权利要求5所述一种矢量空间数据的特征标记系统,其特征在于:所述图形特征指数模块,功能如下:
S301:以某图层L为对象,构建GeoHash网格,并统计每个GeoHash网格中所包含的实际几何图形节点数Pi,计算每个GeoHash网格的空间密度指标为其中Sum(P)表示图层L中所有几何图形的节点总数;
S302:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在图层中的空间密度指数Gpi=M1+M2+…Mn;
S303:以整个空间数据库为对象,构建GeoHash网格,计算每个GeoHash网格中所包含的实际几何图形节点数PKi,计算每个GeoHash网格的空间密度指标为其中Sum(PK)表示空间数据库中所有几何图形的节点总数;
S304:若某空间几何对象在空间上与n个GeoHash网格相交,则该几何对象在空间数据库中的空间密度指数其中N为空间数据库中图层总数;
S305:根据图层L中某图形的几何对象在该图层L中的空间密度指数Gpi和几何对象在空间数据库中的空间密度指数GKpi,基于公式:Geo(pi)=Gpi×GKpi计算出图形对象g的权重值β,得到图层L中各图形对象的权重值序列fg={β1,β2,β3,…,βx},其中βi表示第i个图形对象的图形特征指数值,所述图形特征指数值越大,代表该图形对象在整个空间库中越能成为区别于其它图层的标记关键图形。
8.根据权利要求5所述一种矢量空间数据的特征标记系统,其特征在于:所述标记元模块,具体功能如下:
S401:统计图层L中的所有空间要素,将每个空间要素所含图形特征指数值和文本特征指数值求和得到空间要素的标记指数值Li=θi+βi,
S402:根据标记指数值得到图层L中各空间要素的标记指数值序列f={L1,L2,L3…,Lx},其中Li表示第i个空间要素的标记特征指数值;
S403:从所述标记指数值序列f中选取每个图层中指数值最大的前K个空间要素作为可代表该图层的图属异质性特征标记元对象。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-4任一项所述的矢量空间数据图属异质性特征标记方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310985809.3A CN116932680B (zh) | 2023-08-07 | 2023-08-07 | 矢量空间数据的特征标记方法、系统及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310985809.3A CN116932680B (zh) | 2023-08-07 | 2023-08-07 | 矢量空间数据的特征标记方法、系统及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116932680A true CN116932680A (zh) | 2023-10-24 |
CN116932680B CN116932680B (zh) | 2024-04-02 |
Family
ID=88380756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310985809.3A Active CN116932680B (zh) | 2023-08-07 | 2023-08-07 | 矢量空间数据的特征标记方法、系统及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116932680B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678705A (zh) * | 2013-12-30 | 2014-03-26 | 南京大学 | 一种VCT文件到shapefile文件的矢量数据并行转换方法 |
CN103714145A (zh) * | 2013-12-25 | 2014-04-09 | 中国地质大学(武汉) | 关系型和Key-Value型数据库空间数据索引方法 |
CN107092680A (zh) * | 2017-04-21 | 2017-08-25 | 中国测绘科学研究院 | 一种基于地理网格的政务信息资源整合方法 |
CN108090151A (zh) * | 2017-12-11 | 2018-05-29 | 厦门亿力吉奥信息科技有限公司 | 基于多数据源的空间数据访问方法及存储介质 |
CN109522382A (zh) * | 2018-11-14 | 2019-03-26 | 国家基础地理信息中心 | 空间数据网格化统计方法及装置 |
CN109614454A (zh) * | 2018-11-26 | 2019-04-12 | 武汉大学 | 一种基于mpi的矢量大数据并行空间叠置分析方法 |
CN109871424A (zh) * | 2019-02-28 | 2019-06-11 | 中国科学院地理科学与资源研究所 | 一种中文学术研究热点区域信息自动提取和地图制作方法 |
CN110059067A (zh) * | 2019-04-04 | 2019-07-26 | 南京南瑞水利水电科技有限公司 | 一种水利空间矢量大数据存储管理方法 |
CN111737393A (zh) * | 2020-07-01 | 2020-10-02 | 自然资源部四川基础地理信息中心(自然资源部四川测绘资料档案馆) | 一种web环境下矢量数据自适管理方法及系统 |
CN113435940A (zh) * | 2021-07-08 | 2021-09-24 | 重庆链图信息技术有限公司 | 矢量地理空间数据在线服务多因子运营计价系统 |
CN113627166A (zh) * | 2021-08-09 | 2021-11-09 | 北京智数时空科技有限公司 | 文化生态因子的识别与提取方法及设备和存储介质 |
-
2023
- 2023-08-07 CN CN202310985809.3A patent/CN116932680B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714145A (zh) * | 2013-12-25 | 2014-04-09 | 中国地质大学(武汉) | 关系型和Key-Value型数据库空间数据索引方法 |
CN103678705A (zh) * | 2013-12-30 | 2014-03-26 | 南京大学 | 一种VCT文件到shapefile文件的矢量数据并行转换方法 |
CN107092680A (zh) * | 2017-04-21 | 2017-08-25 | 中国测绘科学研究院 | 一种基于地理网格的政务信息资源整合方法 |
CN108090151A (zh) * | 2017-12-11 | 2018-05-29 | 厦门亿力吉奥信息科技有限公司 | 基于多数据源的空间数据访问方法及存储介质 |
CN109522382A (zh) * | 2018-11-14 | 2019-03-26 | 国家基础地理信息中心 | 空间数据网格化统计方法及装置 |
CN109614454A (zh) * | 2018-11-26 | 2019-04-12 | 武汉大学 | 一种基于mpi的矢量大数据并行空间叠置分析方法 |
CN109871424A (zh) * | 2019-02-28 | 2019-06-11 | 中国科学院地理科学与资源研究所 | 一种中文学术研究热点区域信息自动提取和地图制作方法 |
CN110059067A (zh) * | 2019-04-04 | 2019-07-26 | 南京南瑞水利水电科技有限公司 | 一种水利空间矢量大数据存储管理方法 |
CN111737393A (zh) * | 2020-07-01 | 2020-10-02 | 自然资源部四川基础地理信息中心(自然资源部四川测绘资料档案馆) | 一种web环境下矢量数据自适管理方法及系统 |
CN113435940A (zh) * | 2021-07-08 | 2021-09-24 | 重庆链图信息技术有限公司 | 矢量地理空间数据在线服务多因子运营计价系统 |
CN113627166A (zh) * | 2021-08-09 | 2021-11-09 | 北京智数时空科技有限公司 | 文化生态因子的识别与提取方法及设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116932680B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9098591B2 (en) | Spatio-temporal data management system, spatio-temporal data management method, and machine-readable storage medium thereof | |
CN104050196B (zh) | 一种兴趣点数据冗余检测方法及装置 | |
CN109635068A (zh) | 云计算环境下的海量遥感数据高效组织及快速检索方法 | |
CN109684428A (zh) | 空间数据建设方法、装置、设备及存储介质 | |
CN101853304A (zh) | 基于特征选择和半监督学习的遥感图像检索方法 | |
CN109359172A (zh) | 一种基于图划分的实体对齐优化方法 | |
US8949246B2 (en) | System and method for importing NetCDF data | |
CN109241197A (zh) | 指标展示的数据处理方法、服务器及存储介质 | |
CN112579816B (zh) | 遥感图像的检索方法、装置、电子设备及存储介质 | |
US9116916B2 (en) | Information organizing sytem and information organizing method | |
CN116932680B (zh) | 矢量空间数据的特征标记方法、系统及计算机存储介质 | |
Yu et al. | A heuristic approach to the generalization of complex building groups in urban villages | |
CN107368576A (zh) | 一种教育资源数据采集系统 | |
CN104111947B (zh) | 一种遥感图像的检索方法 | |
Qiao et al. | Rapid trajectory clustering based on neighbor spatial analysis | |
CN115965085A (zh) | 一种基于知识图谱技术的船舶静态属性推理方法及系统 | |
Yokoyama et al. | EBSCAN: An entanglement-based algorithm for discovering dense regions in large geo-social data streams with noise | |
Bao et al. | An automatic extraction method for individual tree crowns based on self-adaptive mutual information and tile computing | |
CN109739840A (zh) | 数据空值处理方法、装置及终端设备 | |
CN115374198A (zh) | 城市全域数据的处理方法及装置 | |
Doulamis et al. | 3D modelling of cultural heritage objects from photos posted over the Twitter | |
CN116431815B (zh) | 一种村务公开数据智慧管理系统 | |
CN108959650A (zh) | 基于共生surf特征的图像检索方法 | |
CN108170729A (zh) | 利用超图融合多模态信息的图像检索方法 | |
Jia et al. | An ontology‐based semantic description model of ubiquitous map images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |