CN104699818B - 一种多源异构的多属性poi融合方法 - Google Patents

一种多源异构的多属性poi融合方法 Download PDF

Info

Publication number
CN104699818B
CN104699818B CN201510133728.6A CN201510133728A CN104699818B CN 104699818 B CN104699818 B CN 104699818B CN 201510133728 A CN201510133728 A CN 201510133728A CN 104699818 B CN104699818 B CN 104699818B
Authority
CN
China
Prior art keywords
poi
attribute
similarity
attributes
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510133728.6A
Other languages
English (en)
Other versions
CN104699818A (zh
Inventor
李霖
邢小雨
周冬波
朱海红
蒋敏
王维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201510133728.6A priority Critical patent/CN104699818B/zh
Publication of CN104699818A publication Critical patent/CN104699818A/zh
Application granted granted Critical
Publication of CN104699818B publication Critical patent/CN104699818B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种多源异构的多属性POI融合方法,首先从POI数据源A、B处获得需要进行融合的数据集,并分别对两异构属性的数据集进行去重处理;分别遍历两数据集中的每个POI,在遵循属性相似度计算规则的前提下,计算各POI每个属性的相似度,得到属性相似度矩阵;求解加权多属性POI相似度向量;计算POI相似度向量中各分量的最大值Max,并与阈值T进行比较;对代表同一地理实体的POI进行不同属性项的增加、同一属性项属性值的合并。该方法通过属性对整体的重要性及影响程度不同,差异化的考虑POI的各不同类型属性,更符合POI融合的实际操作,能够显著提高POI自动融合的准确率和效率。

Description

一种多源异构的多属性POI融合方法
技术领域
本发明属于电子地图的数据处理与数据融合技术领域,尤其涉及一种多源异构的多属性POI(PointOfInterest,兴趣点)融合方法。
背景技术
随着互联网、移动通信、移动定位以及智能移动终端的普及与应用,位置服务已成为提高出行能力、构建智慧型的公众服务、实现智能交通等的重要基础支撑。理论上来说世界上的一切人、事物、事件均可通过相应的定位系统、传感网、互联网、通信网等泛在网络被赋予准确的时间和空间戳印,在实时动态获取位置坐标、位置属性、位置关系、位置时间特征等多源异构信息的基础上,通过歧义消除、信息融合等处理,建立语义关系一致、统一时空地理关联的位置服务地图,将在公众位置服务、政府部门决策、舆情态势感知、人群行为特性分析、流行病预测等方面发挥越来越重要的作用。
POI作为在位置服务地图中表达地理实体及其位置信息(位置坐标、位置属性、位置关系、位置时间特征)的重要载体,已随着位置服务的发展成为一个重要的研究方向。国内外的相关学者围绕POI的获取、志愿者POI的结构化处理、POI的属性表达、POI信息的融合、POI的显示等方面进行了研究,取得了大量的研究成果,有的相关工作也申请了专利。
不同来源的POI信息不仅在数据结构上、组织形式等方面存在差异,而且各自的信息内容、完善和丰富程度、侧重点、覆盖范围等方面也存在较大的差异。如何实现来源不同的POI信息的融合,获得逻辑一致的、结构相同的、内容更丰富的、覆盖范围更广的POI信息,进而实现数据复用,已成为急需解决的问题。
目前在POI信息融合方面国内外研究者提出的解决方案大致有如下几种:基于Ontology的技术;基于空间属性的技术;基于非空间属性的技术;基于空间和非空间属性相结合的技术。但是通过分析这些技术和方法,会发现目前已有的方法尚存在以下缺陷:
缺陷1、虽然基于空间和非空间属性相结合的技术克服了单一基于空间属性或者单一基于非空间属性技术的不足,更加全面的考虑了POI的不同属性,但是,在POI信息的融合过程中,不同属性的重要性及对整体的影响是不同的,现有的公开发表的研究成果中并没有提出一种能够合理的依据不同属性重要性的进行融合方法。
缺陷2、在融合的过程中所使用的数据默认都有至少一个的正例匹配数,但是这在现实情况中是不能保证的。例如,在一个POI来源的数据集中含有某POI,但是在另外的POI来源的数据集中并不一定有代表相同地理实体的POI。现有的方法没有考虑这种情况会对融合、参数的确定等方面产生的影响。
发明内容
为了解决上述问题,本发明提出了一种多源异构的多属性POI融合方法,通过针对不同的属性类型使用不同的属性相似度计算方法,建立属性相似度矩阵;通过使用属性的权重向量有区别的对待POI的不同属性,建立了基于不同属性权重的融合模型;通过使用属性相似度矩阵和属性的权重向量的乘积获得POI相似度向量,以更加符合实际情况的方式确定各参数及阈值。实践表明,本方法能够达到较好的融合效率和准确率,并且原理简单、实现方便,是一种更切合实际的POI融合方法。
本发明所采用的技术方案是:一种多源异构的多属性POI融合方法,其特征在于,包括以下步骤:
步骤1:确定需要进行POI融合的空间范围,从POI数据源A、B处获得需要进行融合的数据集DA、DB,并分别对两异构属性的数据集进行去重处理;
步骤2:分别遍历DA、DB中的每个POI,在遵循属性相似度计算规则的前提下,计算各POI每个属性的相似度sij,得到属性相似度矩阵
所述的属性相似度计算规则为:如果一个属性在第一个数据集中有而在第二个数据集中没有或者在第一个数据集中没有而在第二个数据集中有,则该属性的相似度sij就记为0;如果一个属性在两个数据集中均存在,则按照属性相似度计算公式进行相似度计算;
步骤3:求解加权多属性POI相似度向量
步骤4:令DA中的POI数据为PA,DB中的POI数据为PB,计算POI相似度向量中各分量的最大值Max,并与阈值T进行比较;
步骤5:当Max≥T时,表示PA和PB是代表同一地理实体的POI,对PA和PB进行不同属性项的增加、同一属性项属性值的合并;否则不做任何处理。
作为优选,步骤2中所述的属性的相似度,根据属性类型分为空间属性相似度、无序标称属性相似度、层次结构属性相似度、描述性属性相似度;四类属性相似度的计算公式分别为:
(1)空间属性相似度sij,空间属性是指POI的经度和纬度属性,相似度计算公式如下:
sij=2-dist
dist = ( x i - x j ) 2 + ( y i - y j ) 2 ;
其中,xi、xj为POI的经度;yi、yj为POI的纬度;dist为两POI的欧几里得距离;
(2)无序标称属性相似度sij,无序标称属性是指无程度差别或次序的由字符串组成的属性(如POI名称、地址等属性),相似度计算公式如下:
s ij = 1 3 ( | N 1 ′ | | N 1 | + | N 2 ′ | | N 2 | + | N 1 ′ | - T 1 , 2 2 | N 1 ′ | ) ;
其中,N1、N2为两字符串的长度;N′1、N′2为两字符串中相同字符的数目;T1,2为两个字符串中需要进行字符替换的数目;
(3)层次结构属性相似度sij,层次结构属性是指具有层次结构关系的属性(如POI类别属性),属性值可以是某一层的值或者不同层的值之间的组合,相似度计算公式如下:
s ij = Σ i = 1 n V 1 × V 2 Σ i = 1 n v 1 2 × Σ i = 1 n v 2 2 ;
其中,V1、V2为层次结构属性的概念向量;n为向量的维数;
(4)描述性属性相似度sij,描述性属性是指具有某一中心表达思想的自然语言或类似自然语言描述性的属性(如POI的评论、用户提示、推荐信息等属性),相似度计算公式如下:
s ij = 1 2 [ KLD ( V 1 | | M ) + KLD ( V 2 | | M ) ] ;
其中,KLD(V1||M)、KLD(V2||M)为两向量的相对熵;V1、V2为两描述性属性的主题特征向量。
作为优选,步骤2中所述的属性相似度矩阵的计算方法为,分别计算两数据集中POI的个数及每个POI有多少个属性;对比两个属性,如果两数据集中POI的属性个数相等,则该数值即为属性相似度矩阵的行数;如果两数据集中POI的属性个数不相等,则选择数量较小的一个数值作为属性相似度矩阵的行数;其计算公式如下:
其中,k为数据集DA中的第k个POI;i为数据集DA中POI的第i个属性;j为数据集DB中的第j个POI;sij为数据集DA中的第k个POI的第i个属性与第DB中的第j个POI的相对应的属性相似度;n为数据集DA、DB中POI的属性个数的最小值;m为数据集DB中POI的总数。
作为优选,步骤3中所述的加权多属性POI相似度向量的计算公式如下:
s v k = s v 1 k , s v 2 k . . . , s vm k = a 1 k , a 1 k . . . , a n k · S ij k ;
其中,k为数据集DA中的第k个POI;为数据集DA中的第k个POI与DB中的第1个POI的相似度;m为数据集DB中POI的总数;为数据集DA中的第k个POI的第1个属性的权重;n为数据集DA中POI的属性的总数;权重向量向量各分量代表各个属性在POI融合过程中对整体的影响程度和重要性,也即各个属性的权重。
作为优选,所述的权重向量通过专家打分法、信息量权重法或回归权重法取得。
作为优选,步骤5中所述的不同属性项是指只出现在一个数据集中的属性,将该属性及属性值作为融合后POI的一个属性及属性值;所述的同一属性项是指出现在两个数据集中的属性,将该属性的属性值进行合并作为融合后POI的该属性的属性值。
本发明的技术方案通过差异化的考虑POI的不同属性,体现了在多属性POI融合过程中不同属性对整体的重要性、影响程度的不同;通过针对不同的属性提出了相应的属性相似度计算方法,可以更加准确衡量不同属性之间的相似度;通过使用属性相似度矩阵和属性的权重向量的乘积获得POI相似度向量,舍弃了两个来源不同的POI数据集中至少有一个匹配的正例数的假设,这种情况更符合实际的POI融合的操作。除此之外,实施本发明的技术方案在POI融合过程中只需要人工确定一个阈值即可,极大地提高了生产效率,大大的节省了人力成本,这种POI融合方法相对于传统的人工融合、更新POI数据的模式而言,是一种突破和创新。
附图说明
图1:为本发明实施例的流程示意图;
图2:为本发明实施例的属性相似度矩阵的计算流程。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种多源异构的多属性POI融合方法,包括以下步骤:
步骤1:确定需要进行POI融合的空间范围,从POI数据源A、B处获得需要进行融合的数据集DA、DB,并分别对两异构属性的数据集进行去重处理;
由于POI是不同地理实体的表示,所以在进行POI信息融合时,首先需要考虑POI表示的地理实体的空间范围,该空间范围应为某一城市、某一城市的辖区、或者是某一条道路周边一定缓冲区范围内等代表面状的区域,例如本实施例选择的是湖北省武汉市洪山区作为进行POI融合的空间范围。
分别从POI数据源A、B处获得该空间范围中的所有POI。要进行多源数据的融合,就需要不同的数据源,也就是POI信息的提供商,可以是两个、三个或者多个数据源,如果是三个或多个数据源,可以先进行两两的融合,直到最后还是可以认为是两个数据源。获取数据集的方法可以使用各POI提供商提供的API也可以使用爬虫工具进行自动提取,例如本实施例选择的是百度地图的POI和Google地图的POI,通过使用各自的API,获得了两个数据集DPOI_BaiDu_original、DPOI_Google_original
对两数据集进行去重处理。由于查询数据的原因或者数据提供商的原因,从数据源获得的POI数据集可能会有重复的POI数据即两条不同的POI数据代表的是同一地理实体,这会给后面的计算带来误差,因此需要对数据集中重复的POI进行去重处理。例如本实施例选择对使用API得到的两数据集(DPOI_BaiDu_original、DPOI_Google_original)进行去重,之后得到DPOI_BaiDu、DPOI_Google两个没有重复POI的数据集。
步骤2:分别遍历DPOI_BaiDu、DPOI_Google中的每个POI,在遵循属性相似度计算规则的前提下,计算各POI每个属性的相似度sij,得到属性相似度矩阵
属性相似度计算规则如下:如果一个属性在第一个数据集中有而在第二个数据集中没有或者在第一个数据集中没有而在第二个数据集中有,则该属性的相似度sij就记为0;如果一个属性在两个数据集中均存在,则按照属性相似度计算公式进行相似度计算。
请见图2,为属性相似度的计算流程图,其中属性的相似度计算公式根据属性类型不同分为空间属性相似度、无序标称属性相似度、层次结构属性相似度、描述性属性相似度;
(1)空间属性相似度sij,空间属性是指POI的经度和纬度属性,相似度计算公式如下:
sij=2-dist
dist = ( x i - x j ) 2 + ( y i - y j ) 2
其中,xi、xj为POI的经度;yi、yj为POI的纬度;dist为两POI的欧几里得距离。
(2)无序标称属性相似度sij,无序标称属性是指无程度差别或次序的由字符串组成的属性(如POI名称、地址等属性),相似度计算公式如下:
s ij = 1 3 ( | N 1 ′ | | N 1 | + | N 2 ′ | | N 2 | + | N 1 ′ | - T 1 , 2 2 | N 1 ′ | )
其中,N1、N2为两字符串的长度;N′1、N′2为两字符串中相同字符的数目;T1,2为两个字符串中需要进行字符替换的数目。
(3)层次结构属性相似度sij,层次结构属性是指具有层次结构关系的属性(如POI类别属性),属性值可以是某一层的值或者不同层的值之间的组合,相似度计算公式如下:
s ij = Σ i = 1 n V 1 × V 2 Σ i = 1 n v 1 2 × Σ i = 1 n v 2 2 ;
其中,V1、V2为层次结构属性的概念向量;n为向量的维数。
(4)描述性属性相似度sij,描述性属性是指具有某一中心表达思想的自然语言或类似自然语言描述性的属性(如POI的评论、用户提示、推荐信息等属性),相似度计算公式如下:
s ij = 1 2 [ KLD ( V 1 | | M ) + KLD ( V 2 | | M ) ]
其中,KLD(V1||M)、KLD(V2||M)为两向量的相对熵;V1、V2为两描述性属性的主题特征向量。
属性相似度矩阵计算。分别计算两数据集中POI的个数及每个POI有多少个属性;对比两个属性,如果两数据集中POI的属性个数相等,则该数值即为属性相似度矩阵的行数;如果两数据集中POI的属性个数不相等,则选择数量较小的一个数值作为属性相似度矩阵的行数。例如本实施例中DPOI_BaiDu中有7680个POI,每个POI有ID、名称、地址、省份、城市、类型、空间(经度、纬度)共7个属性;DPOI_Google中有6469个POI,每个POI有名称、地址、类型、电话号码、空间(经度、纬度)共5个属性;则属性相似度矩阵的行数就为5,属性相似度矩阵为:
S ij k = 0.14 0.92 . . . 0.24 0.22 0.76 . . . 0.66 0.1 0.44 . . . 0.82 0 0 . . . 0 0.41 0.96 . . . 0.14 ;
步骤3:求解加权多属性POI相似度向量本发明实施例通过属性的权重向量乘以矩阵得到加权的多属性POI相似度向量计算公式如下:
s v k = s v 1 k , s v 2 k . . . , s vm k = a 1 k , a 1 k . . . , a n k · S ij k
其中,该向量中各分量代表第一个数据集DA中第k个POI与第二个数据集DB中所有POI的相似度;m为数据集DB中POI的总数;为数据集DA中的第k个POI的第1个的权重;n为数据集DA中POI的属性的总数。属性的权重向量可以通过专家打分、信息量权重、回归权重等多种方法取得,例如本实施例通过使用回归权重方法得到名称、地址、类别、电话号码、空间属性(经度、纬度)的权重向量为(0.48,0.27,0.09,0,0.16),各分量代表各个属性在POI融合过程中对整体的影响程度和重要性。
步骤4:判断向量中的各分量的最大值Max并与设定的阈值T进行对比。向量中的分量的最大值代表第一个数据集中第k个POI(PPOI_BaiDu)与第二个数据集中相似度最大的POI(PPOI_Google),即PPOI_BaiDu、PPOI_Google代表同一地理实体的可能性最大,将该相似度值Max与设定的阈值T进行比较,如果Max≥T则表示两个POI代表同一地理实体,对PPOI_BaiDu和PPOL_Google进行不同属性项的增加、同一属性项属性值的合并;如果Max<T则表示两个POI代表不同的地理实体,则不做任何处理。例如本实施例选择T=0.8。
其中不同属性项的增加是指只出现在一个数据集中的属性,将该属性及属性值作为融合后POI的一个属性及属性值;同一属性项属性值的合并是指出现在两个数据集中的属性,将该属性值取自两个POI或者是数值型属性的平均值作为融合后POI的该属性的属性值。例如本实施例通过融合后得到的POI有ID、名称、地址、省份、城市、类型、电话号码、空间属性(经度、纬度)等共8个属性,属性值也更加丰富,其中POI的ID、省份、城市、电话号码属性是不同属性项,属性值由原属性值取得;名称、地址、空间属性(经度、纬度)是同一属性项,属性值取自两POI的属性值或者是数值型属性的平均值。
本实施例的融合前POI的属性及属性值为:
本实施例的融合后POI的属性及属性值为:
{
"ID":"6563045",
"名称":"中百超市彭刘杨路店;中百超市(彭刘杨路店)",
"地址":"洪山区彭刘杨路74号;洪山区彭刘杨路76号附近",
"省份":"湖北",
"城市":"武汉",
"电话":"021-88865860",
"类型":"购物服务,超市",
"经度":"114.244756",
"纬度":"30.579205"
}
本实施例通过使用属性相似度矩阵和属性的权重向量的乘积获得POI相似度向量,舍弃了两个来源不同的POI数据集中至少有一个匹配的正例数的假设,这种情况更符合实际的POI融合的操作。本实施例在POI融合过程中只需要人工确定一个阈值即可,极大地提高了生产效率,大大的节省了人力成本,这种POI融合方法相对于传统的人工融合、更新POI数据的模式而言,是一种突破和创新。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (5)

1.一种多源异构的多属性POI融合方法,其特征在于,包括以下步骤:
步骤1:确定需要进行POI融合的空间范围,从POI数据源A、B处获得需要进行融合的数据集DA、DB,并分别对两异构属性的数据集进行去重处理;
步骤2:分别遍历DA、DB中的每个POI,在遵循属性相似度计算规则的前提下,计算各POI每个属性的相似度sij,得到属性相似度矩阵
所述的属性相似度计算规则为:如果一个属性在第一个数据集中有而在第二个数据集中没有或者在第一个数据集中没有而在第二个数据集中有,则该属性的相似度sij就记为0;如果一个属性在两个数据集中均存在,则按照属性相似度计算公式进行相似度计算;
所述的属性相似度,根据属性类型分为空间属性相似度、无序标称属性相似度、层次结构属性相似度、描述性属性相似度;四类属性相似度的计算公式分别为:
(1)空间属性相似度sij,空间属性是指POI的经度和纬度属性,相似度计算公式如下:
sij=2-dist
d i s t = ( x i - x j ) 2 + ( y i - y j ) 2 ;
其中,xi、xj为POI的经度;yi、yj为POI的纬度;dist为两POI的欧几里得距离;
(2)无序标称属性相似度sij,无序标称属性是指无程度差别或次序的由字符串组成的属性,相似度计算公式如下:
s i j = 1 3 ( | N 1 ′ | | N 1 | + | N 2 ′ | | N 2 | + | N 1 ′ | - T 1 , 2 2 | N 1 ′ | ) ;
其中,N1、N2为两字符串的长度;N′1、N′2为两字符串中相同字符的数目;T1,2为两个字符串中需要进行字符替换的数目;
(3)层次结构属性相似度sij,层次结构属性是指具有层次结构关系的属性,属性值可以是某一层的值或者不同层的值之间的组合,相似度计算公式如下:
s i j = Σ i = 1 n V 1 × V 2 Σ i = 1 n v 1 2 × Σ i = 1 n v 2 2 ;
其中,V1、V2为层次结构属性的概念向量;n为向量的维数;
(4)描述性属性相似度sij,描述性属性是指具有某一中心表达思想的自然语言或类似自然语言描述性的属性,相似度计算公式如下:
s i j = 1 2 [ K L D ( V 1 | | M ) + K L D ( V 2 | | M ) ] ;
其中,KLD(V1||M)、KLD(V2||M)为两向量的相对熵;V1、V2为两描述性属性的主题特征向量;
步骤3:求解加权多属性POI相似度向量
步骤4:令DA中的POI数据为PA,DB中的POI数据为PB,计算POI相似度向量中各分量的最大值Max,并与阈值T进行比较;
步骤5:当Max≥T时,表示PA和PB是代表同一地理实体的POI,对PA和PB进行不同属性项的增加、同一属性项属性值的合并;否则不做任何处理。
2.根据权利要求1所述的多源异构的多属性POI融合方法,其特征在于:步骤2中所述的属性相似度矩阵的计算方法为,分别计算两数据集中POI的个数及每个POI有多少个属性;对比两个属性,如果两数据集中POI的属性个数相等,则该数值即为属性相似度矩阵的行数;如果两数据集中POI的属性个数不相等,则选择数量较小的一个数值作为属性相似度矩阵的行数;其计算公式如下:
S i j k = s 11 K s 1 m M O M s n 1 L s n m ;
其中,k为数据集DA中的第k个POI;i为数据集DA中POI的第i个属性;j为数据集DB中的第j个POI;sij为数据集DA中的第k个POI的第i个属性与第DB中的第j个POI的相对应的属性相似度;n为数据集DA、DB中POI的属性个数的最小值;m为数据集DB中POI的总数。
3.根据权利要求1所述的多源异构的多属性POI融合方法,其特征在于:步骤3中所述的加权多属性POI相似度向量的计算公式如下:
s v k = ( s v 1 k , s v 2 k L , s v m k ) = ( a 1 k , a 1 k L , a n k ) · S i j k ;
其中,k为数据集DA中的第k个POI;为数据集DA中的第k个POI与DB中的第1个POI的相似度;m为数据集DB中POI的总数;为数据集DA中的第k个POI的第1个属性的权重;n为数据集DA中POI的属性的总数;权重向量向量各分量代表各个属性在POI融合过程中对整体的影响程度和重要性,也即各个属性的权重。
4.根据权利要求3所述的多源异构的多属性POI融合方法,其特征在于:所述的权重向量通过专家打分法、信息量权重法或回归权重法取得。
5.根据权利要求1所述的多源异构的多属性POI融合方法,其特征在于:步骤5中所述的不同属性项是指只出现在一个数据集中的属性,将该属性及属性值作为融合后POI的一个属性及属性值;所述的同一属性项是指出现在两个数据集中的属性,将该属性的属性值进行合并作为融合后POI的该属性的属性值。
CN201510133728.6A 2015-03-25 2015-03-25 一种多源异构的多属性poi融合方法 Expired - Fee Related CN104699818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510133728.6A CN104699818B (zh) 2015-03-25 2015-03-25 一种多源异构的多属性poi融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510133728.6A CN104699818B (zh) 2015-03-25 2015-03-25 一种多源异构的多属性poi融合方法

Publications (2)

Publication Number Publication Date
CN104699818A CN104699818A (zh) 2015-06-10
CN104699818B true CN104699818B (zh) 2016-03-02

Family

ID=53346938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510133728.6A Expired - Fee Related CN104699818B (zh) 2015-03-25 2015-03-25 一种多源异构的多属性poi融合方法

Country Status (1)

Country Link
CN (1) CN104699818B (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045880B (zh) * 2015-07-22 2018-09-18 福州大学 一种不同数据源的兴趣点的模糊匹配方法
CN105528399B (zh) * 2015-12-01 2019-02-15 中国联合网络通信集团有限公司 多源终端参数数据融合方法及装置
CN105760515A (zh) * 2016-02-24 2016-07-13 国家电网公司 一种多数据源的同一对象数据的融合方法
CN106021456B (zh) * 2016-05-17 2020-02-21 中山大学 将文本和地理信息融合在局部协同排列的兴趣点推荐方法
CN107807939B (zh) * 2016-09-09 2021-12-28 阿里巴巴集团控股有限公司 数据对象的整理方法及设备
CN108287816B (zh) * 2017-01-10 2021-06-04 腾讯科技(深圳)有限公司 兴趣点在线检测、机器学习分类器训练方法和装置
CN108460046A (zh) * 2017-02-21 2018-08-28 菜鸟智能物流控股有限公司 一种地址聚合的方法以及设备
CN106874962B (zh) * 2017-03-13 2020-09-01 上海普适导航科技股份有限公司 多源卫星数据的融合方法及装置
CN108628866B (zh) * 2017-03-20 2020-11-06 大有秦鼎(北京)科技有限公司 数据融合的方法和装置
CN107133262B (zh) * 2017-03-30 2019-09-06 浙江大学 一种基于多影响嵌入的个性化poi推荐方法
CN107341220B (zh) * 2017-06-28 2020-05-12 阿里巴巴集团控股有限公司 一种多源数据融合方法和装置
CN107330734B (zh) * 2017-07-03 2020-07-31 云南大学 基于Co-location模式和本体的商业地址选择方法
CN107609186B (zh) * 2017-09-30 2020-09-22 百度在线网络技术(北京)有限公司 信息处理方法及装置、终端设备及计算机可读存储介质
CN107729519B (zh) * 2017-10-27 2020-06-09 上海数据交易中心有限公司 基于多源多维数据的评估方法及装置、终端
CN107832404A (zh) * 2017-11-02 2018-03-23 武汉大学 一种poi信息的补全方法
CN107798137B (zh) * 2017-11-23 2018-12-18 霍尔果斯智融未来信息科技有限公司 一种基于可加模型的多源异构数据融合架构系统
CN108009241B (zh) * 2017-11-30 2021-12-07 瞳见科技有限公司 一种基于pso参数优化的工业物联网安全聚合关联方法
CN108629001A (zh) * 2018-05-03 2018-10-09 成都瀚涛天图科技有限公司 一种地理信息大数据的去重方法
CN109033465A (zh) * 2018-08-31 2018-12-18 北京诸葛找房信息技术有限公司 基于地理位置与名字相似的多平台小区合并方法
CN109193934A (zh) * 2018-09-06 2019-01-11 江苏佳源科技有限公司 一种信息融合及故障点测距的新一代智能配电终端
CN109543712B (zh) * 2018-10-16 2023-04-07 哈尔滨工业大学 时态数据集上的实体识别方法
CN109270403A (zh) * 2018-10-16 2019-01-25 江苏佳源科技有限公司 一种信息融合及故障点测距的新一代智能配电终端
CN109620261A (zh) * 2018-12-06 2019-04-16 郑州大学第附属医院 一种精神压力测量系统及方法
CN109947881B (zh) * 2019-02-26 2023-10-27 广州城市规划技术开发服务部有限公司 一种poi判重方法、装置、移动终端及计算机可读存储介质
CN111767348A (zh) * 2019-04-02 2020-10-13 上海晶赞融宣科技有限公司 数据融合方法及装置、存储介质、服务器
CN110222200A (zh) * 2019-06-20 2019-09-10 京东方科技集团股份有限公司 用于实体融合的方法和设备
CN110263117B (zh) * 2019-06-25 2024-04-26 深圳市腾讯计算机系统有限公司 一种用于确定兴趣点poi数据的方法与装置
CN110533450A (zh) * 2019-07-17 2019-12-03 上海数据交易中心有限公司 数据流通方法及装置、存储介质、服务器
CN110489507B (zh) * 2019-08-16 2023-03-31 腾讯科技(深圳)有限公司 确定兴趣点相似度的方法、装置、计算机设备和存储介质
CN110851547A (zh) * 2019-10-11 2020-02-28 上海中旖能源科技有限公司 一种多数据源地图数据融合方法
CN111105124B (zh) * 2019-10-28 2023-08-01 东华理工大学 一种基于距离约束的多地标影响力的计算方法
CN112925773A (zh) * 2019-12-10 2021-06-08 中国再保险(集团)股份有限公司 一种构建行业风险暴露数据库的poi数据清洗与融合方法及装置
CN112925764B (zh) * 2019-12-10 2023-09-12 中国再保险(集团)股份有限公司 一种巨灾模型的行业风险暴露数据库及其构建方法
CN111950627B (zh) * 2020-08-11 2024-04-05 重庆大学 一种多源信息融合方法及其应用
CN111814027B (zh) * 2020-08-26 2023-03-21 电子科技大学 基于搜索引擎的多源人物属性融合方法
CN112487122B (zh) * 2020-12-02 2024-05-17 电信科学技术第十研究所有限公司 地址归一化处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102306177A (zh) * 2011-08-25 2012-01-04 清华大学 一种多策略组合的本体或实例匹配方法
CN103246685A (zh) * 2012-02-14 2013-08-14 株式会社理光 将对象实例的属性规则化为特征的方法和设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102306177A (zh) * 2011-08-25 2012-01-04 清华大学 一种多策略组合的本体或实例匹配方法
CN103246685A (zh) * 2012-02-14 2013-08-14 株式会社理光 将对象实例的属性规则化为特征的方法和设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《基于空间位置信息的多源POI数据融合问题的研究》;高新院;《中国优秀硕士学位论文全文数据库》;20140315;第22,23,37,38页 *
《空间数据融合技术的研究》;彭煜玮等;《计算机工程》;20070930;第33卷(第18期);全文 *

Also Published As

Publication number Publication date
CN104699818A (zh) 2015-06-10

Similar Documents

Publication Publication Date Title
CN104699818B (zh) 一种多源异构的多属性poi融合方法
CN110472066B (zh) 一种城市地理语义知识图谱的构建方法
Corcoran et al. Analysing the growth of OpenStreetMap networks
Liu Combining GIS and the Huff Model to Analyze Suitable Locations for a New Asian Supermarket in the Minneapolis and St. Paul, Minnesota USA
Li et al. Transportation mode identification with GPS trajectory data and GIS information
CN103995837A (zh) 一种基于群体足迹的个性化旅游路线规划方法
Wang et al. Detecting transportation modes based on LightGBM classifier from GPS trajectory data
US20160125307A1 (en) Air quality inference using multiple data sources
CN108108844A (zh) 一种城市人流量预测方法及系统
CN110457420A (zh) 兴趣点位置识别方法、装置、设备及存储介质
CN107133262A (zh) 一种基于多影响嵌入的个性化poi推荐方法
Hu et al. Extraction and monitoring approach of dynamic urban commercial area using check-in data from Weibo
Chen et al. VTracer: When online vehicle trajectory compression meets mobile edge computing
CN108256590A (zh) 一种基于复合元路径的相似出行者识别方法
Bwambale et al. Modelling long-distance route choice using mobile phone call detail record data: a case study of Senegal
Wang et al. Spatial distribution pattern of the customer count and satisfaction of commercial facilities based on social network review data in Beijing, China
Montini et al. Route and mode choice models using GPS data
Zhu et al. Probabilistic routing using multimodal data
CN105893352A (zh) 一种基于社交网络大数据的空气质量预警和监测分析系统
Devendran et al. Analysis and prediction of urban growth using neural-network-coupled agent-based cellular automata model for Chennai Metropolitan Area, Tamil Nadu, India
Zhang et al. Knowledge and topology: A two layer spatially dependent graph neural networks to identify urban functions with time-series street view image
CN108536825A (zh) 一种识别房源数据是否重复的方法
CN110377678A (zh) 城市地铁站域的认知场所特征识别方法及系统
Huang et al. Hierarchical destination prediction based on GPS history
CN113298314A (zh) 一种考虑动态时空相关性的轨道交通客流预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160302

Termination date: 20190325