CN105307121A - 一种信息处理方法及装置 - Google Patents

一种信息处理方法及装置 Download PDF

Info

Publication number
CN105307121A
CN105307121A CN201510673205.0A CN201510673205A CN105307121A CN 105307121 A CN105307121 A CN 105307121A CN 201510673205 A CN201510673205 A CN 201510673205A CN 105307121 A CN105307121 A CN 105307121A
Authority
CN
China
Prior art keywords
information
accumulation
distance
unit
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510673205.0A
Other languages
English (en)
Other versions
CN105307121B (zh
Inventor
汤奇峰
吴郑伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zamplus Technology Development Co Ltd
Original Assignee
Shanghai Zamplus Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zamplus Technology Development Co Ltd filed Critical Shanghai Zamplus Technology Development Co Ltd
Priority to CN201510673205.0A priority Critical patent/CN105307121B/zh
Publication of CN105307121A publication Critical patent/CN105307121A/zh
Application granted granted Critical
Publication of CN105307121B publication Critical patent/CN105307121B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

一种信息处理方法及装置,所述方法包括:获取实时地理位置信息,所述实时地理位置信息包括地理位置信息和与该地理位置信息对应的时间信息;存储获取到的所述实时地理位置信息;对存储的所述地理位置信息进行聚类计算,以发现聚点;基于所述聚点划分功能区域,识别所述功能区域的人流量模式;参照所述功能区域内的人流量模式,判断所述功能区域的功能。所述方法及装置可以提升信息处理的准确率。

Description

一种信息处理方法及装置
技术领域
本发明涉及信息处理领域,尤其涉及一种信息处理方法及装置。
背景技术
随着数据获取手段的丰富,针对空间数据的研究也不再集中在测绘、国土等专门领域。近几年,除了传统的GPS定位数据,逐渐兴起了利用多种形式的空间位置数据,如手机定位数据、公交卡签到以及带有地理标签的图片等数据,对人类的空间活动范围和规律进行研究。针对空间位置数据的信息处理方法也逐渐成为新的研究方向。
现有技术中基于空间位置信息的信息处理方法的准确性有待提高。
发明内容
本发明解决的技术问题是提高基于空间位置信息的信息处理方法的准确性。
为解决上述技术问题,本发明实施例提供一种信息处理方法,包括:
获取实时地理位置信息,所述实时地理位置信息包括地理位置信息和与该地理位置信息对应的时间信息;
存储获取到的所述实时地理位置信息;
对存储的所述地理位置信息进行聚类计算,以发现聚点;
基于所述聚点划分功能区域,识别所述功能区域的人流量模式;参照所述功能区域内的人流量模式,判断所述功能区域的功能。
可选的,所述信息处理方法还包括:
获取用户预设周期内的实时地理位置信息;
基于所述用户预设周期内的实时地理位置信息,和所述功能区域的功能,判断与所述用户对应的功能区域。
可选的,所述对存储的所述实时地理位置信息进行聚类计算,以发现聚点包括:
设置窗口半径数值,基于所述窗口半径数值,分别计算各地理位置信息对应的核密度函数;
分别对所述核密度函数求导,判断各实时地理位置信息对应的点的高密度方向;
将所述各用户的地理位置信息分别向与其对应的高密度方向移动,直至所述移动位移小于预设值,以得到候选聚点;
对所述候选聚点进行分类,以得到分类的点集合;
选取各个所述分类的点集合的中心位置为所述聚点。
可选的,所述对所述候选聚点进行分类,以得到各个分类的点集合包括:
设置初始的所述点集合为空集;
对各个地理位置信息计算分类距离,所述分类距离是当前点集合与所述地理位置信息对应的点的距离;
比较所述分类距离中的最小值与预设的距离阈值;
若所述分类距离中的最小分类距离小于预设的距离阈值,将该地理位置信息加入所述最小分类距离对应的点集合;
若所述分类距离中的最小分类距离大于预设的距离阈值,则创建新的点集合,该地理位置信息为所述新的点集合的元素。
可选的,所述对存储的所述实时地理位置信息进行聚类计算,以发现聚点还包括:利用每个地理位置信息对应的核密度函数值的箱型图,以排除异常点。
可选的,所述判断所述功能区域的功能还包括:参照所述功能区域内的兴趣点,判断所述功能区域的功能。
本发明实施例还提供一种信息处理装置,包括:实时地理位置信息获取单元、存储单元、聚点发现单元以及功能判定单元;其中:
可选的,所述实时地理位置信息包括地理位置信息和与该地理位置信息对应的时间信息;
所述存储单元,适于存储获取到的所述实时地理位置信息;
所述聚点发现单元,适于对存储的所述地理位置信息进行聚类计算,以发现聚点;
所述功能判定单元,适于基于所述聚点划分功能区域,识别所述功能区域的人流量模式;参照所述功能区域内的人流量模式,判断所述功能区域的功能。
可选的,所述实时地理位置信息获取单元还适于:获取用户预设周期内的实时地理位置信息;所述功能判定单元还适于:基于所述用户预设周期内的实时地理位置信息,和所述功能区域的功能,判断与所述用户对应的功能区域。
可选的,所述聚点发现单元包括:窗口半径设置单元、高密度方向计算单元、候选聚点计算单元、分类单元以及聚点确定单元,其中:
所述窗口半径设置单元,适于设置窗口半径数值,基于所述窗口半径数值,分别计算各地理位置信息对应的核密度函数;
所述高密度方向计算单元,适于分别对所述核密度函数求导,判断各实时地理位置信息对应的点的高密度方向;
所述候选聚点计算单元,适于将所述各用户的地理位置信息分别向与其对应的高密度方向移动,直至所述移动位移小于预设值,以得到候选聚点;
所述分类单元对所述候选聚点进行分类,以得到分类的点集合;
所述聚点确定单元,适于选取各个所述分类的点集合的中心位置为所述聚点。
可选的,所述分类单元包括:初始设置单元、分类距离计算单元、距离比较单元、点集合扩充单元以及点集合新建单元;其中:
所述初始设置单元,设置初始的所述点集合为空集;
所述分类距离计算单元,适于对各个地理位置信息计算分类距离,所述分类距离是当前点集合与所述地理位置信息对应的点的距离;
所述距离比较单元,适于比较所述分类距离中的最小值与预设的距离阈值;
所述点集合扩充单元,适于在所述分类距离中的最小分类距离小于预设的距离阈值时,将该地理位置信息加入所述最小分类距离对应的点集合;
所述点集合新建单元,适于在所述分类距离中的最小分类距离大于预设的距离阈值时,创建新的点集合,该地理位置信息为所述新的点集合的元素。
可选的,所述聚点发现单元还适于利用每个地理位置信息对应的核密度函数值的箱型图,以排除异常点。
可选的,所述功能判定单元还适于参照所述功能区域内的兴趣点,判断所述功能区域的功能。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
通过获取实时地理位置信息,对存储的所述地理位置信息进行聚类计算,以发现聚点,使得聚点的发现是基于获取的地理位置信息的,而并非随意设置,从而可以使得聚点的设置更为合理,从而使得信息处理方法的准确性更高。通过识别基于聚点划分的功能区域的流量模式,判断所述功能区域的功能,使得判断功能区域适于不同的流量模式,可以对不同的流量模式进行不同的判断处理,使得判断过程更具针对性,从而可以提升信息处理方法的准确性。
附图说明
图1是本发明实施例中一种信息处理系统的结构示意图;
图2是本发明实施例中一种信息处理方法的流程图;
图3是本发明实施例中一种聚点的发现过程的流程图;
图4是本发明实施例中一种对候选聚点进行分类过程的流程图;
图5是本发明实施例中一种人流量模式的示意图;
图6是本发明实施例中一种信息处理装置的结构示意图;
图7是本发明实施例中一种聚点发现单元的结构示意图;
图8是本发明实施例中一种分类单元的结构示意图。
具体实施方式
如前所述,随着数据获取手段的丰富,针对空间数据的研究也不再集中在测绘、国土等专门领域。近几年,除了传统的GPS定位数据,逐渐兴起了利用多种形式的空间位置数据,如手机定位数据、公交卡签到以及带有地理标签的图片等数据,对人类的空间活动范围和规律进行研究。针对空间位置数据的信息处理方法也逐渐成为新的研究方向。现有技术中基于空间位置信息的信息处理方法的准确性有待提高。
本发明实施例通过获取实时地理位置信息,对存储的所述地理位置信息进行聚类计算,以发现聚点,使得聚点的发现是基于获取的地理位置信息的,而并非随意设置,从而可以使得聚点的设置更为合理,从而使得信息处理方法的准确性更高。通过识别基于聚点划分的功能区域的流量模式,判断所述功能区域的功能,使得判断功能区域适于不同的流量模式,可以对不同的流量模式进行不同的判断处理,使得判断过程更具针对性,从而可以提升信息处理方法的准确性。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1是本发明实施例中一种信息处理系统的结构示意图。
信息处理服务器11可以获取客户端12的实时地理位置信息,实时地理位置信息包括地理位置信息和与该地理位置信息对应的时间信息。客户端12可以包括多个客户端:客户端1、客户端2……客户端N。
客户端12可以是便携式智能设备,例如可以是手机、平板电脑、智能穿戴设备等。
实时地理位置信息可以是利用基站定位的数据或APP定位数据,或者是二者的结合。
基站定位是目前手机定位最常见的方式。每次手机用户接打电话、收发短信或者使用数据通讯服务时,系统就记录一个手机的位置点。但是研究发现手机定位数据是离散和稀疏的。目前随着打车软件等APP的兴起,许多APP都会要求获取用户的定位信息,所以结合基站定位数据和APP定位数据是一种比较有效的方式。
地理位置信息以坐标表示。目前常用的坐标体系有:
GPS,WGS-84,原始坐标体系,一般用国际标准的GPS记录仪记录下来的坐标,都是GPS的坐标;
GCJ-02,国测局02年发布的坐标体系,又称“火星坐标”。在中国,必须至少使用GCJ-02的坐标体系。比如谷歌,腾讯,高德都在用这个坐标体系。GCJ-02也是国内最广泛使用的坐标体系。
其他坐标体系。一般都是由GCJ-02进过偏移算法得到的。这种体系就根据每个公司的不同,坐标体系都不一样了。比如,百度和搜狗就使用自己的坐标体系,与其他坐标体系不兼容。
基站定位系统使用的是GCJ-02坐标体系,手机APP软件因为通常使用百度应用程序编程接口(ApplicationProgrammingInterface,API),所以使用百度坐标体系。
可以把APP广播的百度体系坐标转换成GCJ-02体系坐标,从而统一两个数据源的信息。假设一个百度经纬度坐标(x,y),其中x为经纬,y为纬度,则:
y ′ = ( x 2 + y 2 + 0.00002 * sin ( y * π * 3000.0 180.0 ) ) sin ( a tan 2 ( y , x ) + 0.000003 * cos ( x * π * 3000.0 180.0 ) )
其中x′为GCJ-02体系经度,y′为GCJ-02体系纬度。
可以将两个数据源的实时地理位置信息整理成:用户ID(唯一标识用户的代码),经纬度,广播时间的格式。
图2是本发明实施例中一种信息处理方法的流程图。
S21,获取实时地理位置信息,所述实时地理位置信息包括地理位置信息和与该地理位置信息对应的时间信息
实时地理位置信息的来源与对所述实时地理位置信息的处理方式参见图1中描述,此处不做赘述。
S22,存储获取到的所述实时地理位置信息。
由于对实时地理位置信息的处理时对多个客户端的地理位置信息的集中处理,故需对获取到的所述实时地理位置信息进行存储。
S23,对存储的所述地理位置信息进行聚类计算,以发现聚点。
目前常用的聚类算法有K-Means(K-平均算法算法)和GMM(高斯混合模型),但是对于我们的使用场景,这两个算法有以下缺点:1)需要事先制定聚类点的数量,但是在我们的使用场景了并不清楚有多少聚点;2)面对大量数据K-Means和GMM的运行时间比较长。
经发明人研究发现:功能区域,例如家庭和工作区域往往是人群比较密集的区域,所以本发明实施例寻找聚点的过程实际是寻找密集集中的点的过程。
在具体实施中,对存储的所述地理位置信息进行聚类计算,以发现聚点的过程可以是针对某时间段内的地理位置信息进行。
对存储的地理位置信息进行聚类计算以发现聚点的过程可以参见图3。
S231,设置窗口半径数值,基于所述窗口半径数值,分别计算各地理位置信息对应的核密度函数。
在具体实施中,实时地理位置信息中的地理位置信息可以是对应某段时间段的经纬度点,假设在2维平面上有n个经纬度点xi,t=1,...,n,可以选取核函数:
K ( x ) = ( 2 π ) - 1 exp ( - 1 2 | | x | | 2 ) ;
可以选取核密度函数:
f ( x ) = 1 Rh 2 Σ i = 1 n K ( x - x i h ) ;
其中,h为窗口半径,可以设置h=100米。窗口半径可以根据业务精度的需求设置,从而满足多样化的需求。
S232,分别对所述核密度函数求导,判断各实时地理位置信息对应的点的高密度方向。
在具体实施中,在步骤S232之前,还可以利用每个地理位置信息对应的核密度函数值的箱型图,以排除异常点。
因为步骤S21中得到的经纬度点会有一些远离中心的异常点,如果不排除的话会影响下一步寻找聚点的结果,排除异常点后可以减小计算量,并提升信息处理方法的准确性。可以通过计算每个地理位置信息对应核密度函数值的箱形图的方式,来排除这些异常点。箱形图的上边缘为上四分位的值加上1.5倍四分位距,下边缘为下四分位的值减去1.5倍四分位距。上下边缘之外的点为异常点。
通过求得核密度函数的导数,就可以获悉寻找密度高的点的方向。核密度函数的导数为:
▿ f ( x ) = 1 nh 4 π Σ i = 1 n ( x i - x ) g ( | | x - x i h | | 2 ) = 1 nh 4 π [ Σ i = 1 n g ( | | x - x i h | | 2 ) ] [ Σ i = 1 n x i g ( | | x - x i h | | ) Σ i = 1 n g ( | | x - x i h | | 2 ) - x ]
其中,g(x)=-k′(x)。
S233,将所述各用户的地理位置信息分别向与其对应的高密度方向移动,直至所述移动位移小于预设值,以得到候选聚点。
在具体实施中,平均移动距离可以是:
m h ( x ) = Σ i = 1 n x i g ( | | x - x i h | | 2 ) Σ i = 1 n , q ( | | x - x i h | | 2 ) - x
从每一个点xt出发,计算它的移动方向mh(xt),移动xt到xt+1,xt+1=xt+mh(xt),重复步骤S233直到|xt+1-xt|<eps,eps为预设值,也就是事先确定的阈值,例如可以定为0.01。
S234,对所述候选聚点进行分类,以得到各个分类的点集合。
对候选聚点进行分类,得到各个分类的点集合的过程其实是对候选聚点进一步聚合的过程。
在具体实施中,可以参照如图4中的流程实现。
S2341,设置初始的所述点集合为空集。
S2342,对各个地理位置信息计算分类距离,所述分类距离是当前点集合与所述地理位置信息对应的点的距离。
当前点集合指当前存在的点集合,可以是一个或多个点集合;在初始的点集合为空集时也就是不存在点集合时,该分类距离可以视作无穷大。点集合可以包括个点,将集合中所有点到待计算的地理位置信息对应点距离最小的距离,作为待计算的地理位置信息对应点到该集合的距离。
S2343,比较所述分类距离中的最小值与预设的距离阈值,若所述分类距离中的最小分类距离小于预设的距离阈值,进入步骤S2344;若所述分类距离中的最小分类距离大于预设的距离阈值,则进入步骤S2345。
S2344,将该地理位置信息加入所述最小分类距离对应的点集合。
S2345,创建新的点集合,该地理位置信息为所述新的点集合的元素。
在对所有候选聚点进行分类后,进入步骤S235。
S235,选取各个所述分类的点集合的中心位置为所述聚点。
每个分类的点集合中可以包括一个或多个点,当包括多个点时,中心位置可以是根据所有点的坐标求得;当仅包括一个点时,可以将该点作为中心位置。
S24,基于所述聚点划分功能区域,识别所述功能区域的人流量模式;参照所述功能区域内的人流量模式,判断所述功能区域的功能。
聚点的计算过程是利用存储的实时地理位置信息,存储的实时地理位置信息与计算出的聚点之间存在对应关系。根据该对应关系可以判断以聚点划分的功能区域,以及该功能区域不同时间的人流量分布,从而可以识别不同功能区域的人流量模式。
现行方法主要依靠常识在时间维度上来区分家庭和工作区域。具体来说00:00~06:00位置点比例最高的区域作为家庭在区域,08:30~11:30和14:30~17:30时段内的区域为工作区域,或其他硬性的时间划分。
但是使用这种事先规定的硬性时间规则并不能适用于不同的城市情况,只是对定性分析的一种简单的定量提取。本发明实施例更加充分的利用定性分析,通过分析人流量模式,更加准确的划分功能区域的功能。
在本发明一实施例中,通过如下方式识别所述功能区域的人流量模式:
将一个工作日划分成24个时间段,[0,1),[1,2),…,[23,24);整理聚点在0-24点每个小时段出现的人数到矩阵:
其中At,i表示第i个聚点的所有从属经纬度点在[t-1,t)时间段出现的人数,人数的识别通过对实时地理位置信息的分析得到。
因为靠近城市中心的聚点人流量相对比较高,而城市郊区的聚点人流量相对比较低。为了能够对每个聚点统一的分析出人流量的定量模式,需要对数据进行标准化转换,就是对于在每个时间段每个聚点出现的人数减去这个聚点一天内人数的平均值,再除以一天人数变化的方差。定量表示为:
Z i , j = x i j - x ~ j s j , i = 1 , 2 , ... , 24 ; j = 1 , 2 , ... , n
其中, x ‾ j = Σ i = 1 n x i j n , s j 2 = Σ i = 1 n ( x i j - x j ‾ ) 2 n - 1 .
求出协方差矩阵:
C = 1 n ZZ T
求出协方差矩阵C的特征值和对应的特征向量,将特征向量按对应特征值大小从大到小排列,去前两列的特征向量v,其对应的特征值λ。
特征向量v就是我们要找的人流量模式,例如可以是区别家庭地点和工作地点的模式;反映该发现模式的解释度。实验发现如果不经过之前对大量实时地理位置信息对应点的聚类处理,这个人流量模式的解释度只有50%左右。通过聚类处理,发现的人流量模式的解释度会增加到90%左右,表明本发明实施例中的信息处理方法可以更加准确的识别功能区域的人流量模式。
本发明实施例中一种人流量模式的示意图可以参见图5。图中横向代表时间,数字代表具体的时间值;纵向代表人流量值。可以看出这个模式显示的是0-8点和20-24点的人流量较少,活跃度较低,9-19点人流量较大,活跃度较高的一种模式。
判断所述功能区域的功能可以结合地理位置信息对应区域的生活习惯判断。也可以简单的是区分工作区域和家庭区域,例如图5中是0-8点和20-24点活跃度较低,9-19点活跃度较高的一种模式,这也正是工作区域的模式,而与之相反的是家庭区域的模式。
在具体实施中,判断功能区域的功能还可以参照所述功能区域内的兴趣点,判断所述功能区域的功能。
在具体实施中,可以对已发现的人流量模式进行分类并存储。
通过已发现的人流量模式,计算出每个聚点对应于这种模式的系数,从而对聚点进行住宅区域和工作区域的划分。
向量X=Av,X为n维向量,当Xi≤0时,将i对应的聚点判断为住宅区域;当Xi>0时,将i对应的聚点判断为工作区域。
在具体实施中,所述信息处理方法还可以包括:获取用户预设周期内的实时地理位置信息;基于所述用户预设周期内的实时地理位置信息,和所述功能区域的功能,判断与所述用户对应的功能区域。
通过获取用户预设周期内的实时地理位置信息,可以分析用户一天的行为轨迹,结合聚点的信息,可以得到用户的住宅和工作区域,具体过程可以是:将实时地理位置信息数据整理成用户及其出现过的地理位置信息和出现的次数;将这些地理位置信息根据距离最近原则确定其所属的聚点;再将上述数据转换成用户及其出现过的聚点和出现的次数;在已经判断出每个聚点的功能时,例如是住宅或工作,然后将一天用户行为轨迹中出现次数最多的住宅聚点作为该用户的住宅地点,将其出现次数最多的工作聚点作为该用户的工作地点。
本发明实施例通过获取实时地理位置信息,对存储的所述地理位置信息进行聚类计算,以发现聚点,使得聚点的发现是基于获取的地理位置信息的,而并非随意设置,从而可以使得聚点的设置更为合理,从而使得信息处理方法的准确性更高。通过识别基于聚点划分的功能区域的流量模式,判断所述功能区域的功能,使得判断功能区域适于不同的流量模式,可以对不同的流量模式进行不同的判断处理,使得判断过程更具针对性,从而可以提升信息处理方法的准确性。
本发明实施例还提供一种信息处理装置,如图6所示。
信息处理装置包括:实时地理位置信息获取单元61、存储单元62、聚点发现单元63以及功能判定单元64;其中:
所述实时地理位置信息获取单元61,适于获取实时地理位置信息,所述实时地理位置信息包括地理位置信息和与该地理位置信息对应的时间信息;
所述存储单元62,适于存储获取到的所述实时地理位置信息;
所述聚点发现单元63,适于对存储的所述地理位置信息进行聚类计算,以发现聚点;
所述功能判定单元64,适于基于所述聚点划分功能区域,识别所述功能区域的人流量模式;参照所述功能区域内的人流量模式,判断所述功能区域的功能。
在具体实施中,所述实时地理位置信息获取单元61还适于:获取用户预设周期内的实时地理位置信息;所述功能判定单元还适于:基于所述用户预设周期内的实时地理位置信息,和所述功能区域的功能,判断与所述用户对应的功能区域。
在具体实施中,所述聚点发现单元63可以包括:窗口半径设置单元631(参见图7,以下结合图7进行说明)、高密度方向计算单元632、候选聚点计算单元633、分类单元634以及聚点确定单元635,其中:
所述窗口半径设置单元631,适于设置窗口半径数值,基于所述窗口半径数值,分别计算各地理位置信息对应的核密度函数;
所述高密度方向计算单元632,适于分别对所述核密度函数求导,判断各实时地理位置信息对应的点的高密度方向;
所述候选聚点计算单元633,适于将所述各用户的地理位置信息分别向与其对应的高密度方向移动,直至所述移动位移小于预设值,以得到候选聚点;
所述分类单元634对所述候选聚点进行分类,以得到分类的点集合;
所述聚点确定单元635,适于选取各个所述分类的点集合的中心位置为所述聚点。
在具体实施中,分类单元634可以包括:初始设置单元6341(参见图8,以下结合图8进行说明)、分类距离计算单元6342、距离比较单元6343、点集合扩充单元6344以及点集合新建单元6345;其中:
所述初始设置单元6341,设置初始的所述点集合为空集;
所述分类距离计算单元6342,适于对各个地理位置信息计算分类距离,所述分类距离是当前点集合与所述地理位置信息对应的点的距离;
所述距离比较单元6343,适于比较所述分类距离中的最小值与预设的距离阈值;
所述点集合扩充单元6344,适于在所述分类距离中的最小分类距离小于预设的距离阈值时,将该地理位置信息加入所述最小分类距离对应的点集合;
所述点集合新建单元6345,适于在所述分类距离中的最小分类距离大于预设的距离阈值时,创建新的点集合,该地理位置信息为所述新的点集合的元素。
在具体实施中,所述聚点发现单元63还适于利用每个地理位置信息对应的核密度函数值的箱型图,以排除异常点。
在具体实施中,所述功能判定单元64还适于参照所述功能区域内的兴趣点,判断所述功能区域的功能。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (12)

1.一种信息处理方法,其特征在于,包括:
获取实时地理位置信息,所述实时地理位置信息包括地理位置信息和与该地理位置信息对应的时间信息;
存储获取到的所述实时地理位置信息;
对存储的所述地理位置信息进行聚类计算,以发现聚点;
基于所述聚点划分功能区域,识别所述功能区域的人流量模式;参照所述功能区域内的人流量模式,判断所述功能区域的功能。
2.根据权利要求1所述的信息处理方法,其特征在于,所述信息处理方法还包括:
获取用户预设周期内的实时地理位置信息;
基于所述用户预设周期内的实时地理位置信息,和所述功能区域的功能,判断与所述用户对应的功能区域。
3.根据权利要求1所述的信息处理方法,其特征在于,所述对存储的所述实时地理位置信息进行聚类计算,以发现聚点包括:
设置窗口半径数值,基于所述窗口半径数值,分别计算各地理位置信息对应的核密度函数;
分别对所述核密度函数求导,判断各实时地理位置信息对应的点的高密度方向;
将所述各用户的地理位置信息分别向与其对应的高密度方向移动,直至所述移动位移小于预设值,以得到候选聚点;
对所述候选聚点进行分类,以得到分类的点集合;
选取各个所述分类的点集合的中心位置为所述聚点。
4.根据权利要求3所述的信息处理方法,其特征在于,所述对所述候选聚点进行分类,以得到各个分类的点集合包括:
设置初始的所述点集合为空集;
对各个地理位置信息计算分类距离,所述分类距离是当前点集合与所述地理位置信息对应的点的距离;
比较所述分类距离中的最小值与预设的距离阈值;
若所述分类距离中的最小分类距离小于预设的距离阈值,将该地理位置信息加入所述最小分类距离对应的点集合;
若所述分类距离中的最小分类距离大于预设的距离阈值,则创建新的点集合,该地理位置信息为所述新的点集合的元素。
5.根据权利要求3所述的信息处理方法,其特征在于,所述对存储的所述实时地理位置信息进行聚类计算,以发现聚点还包括:利用每个地理位置信息对应的核密度函数值的箱型图,以排除异常点。
6.根据权利要求1所述的信息处理方法,其特征在于,所述判断所述功能区域的功能还包括:参照所述功能区域内的兴趣点,判断所述功能区域的功能。
7.一种信息处理装置,其特征在于,包括:实时地理位置信息获取单元、存储单元、聚点发现单元以及功能判定单元;其中:
所述实时地理位置信息获取单元,适于获取实时地理位置信息,所述实时地理位置信息包括地理位置信息和与该地理位置信息对应的时间信息;
所述存储单元,适于存储获取到的所述实时地理位置信息;
所述聚点发现单元,适于对存储的所述地理位置信息进行聚类计算,以发现聚点;
所述功能判定单元,适于基于所述聚点划分功能区域,识别所述功能区域的人流量模式;参照所述功能区域内的人流量模式,判断所述功能区域的功能。
8.根据权利要求7所述的信息处理装置,其特征在于,所述实时地理位置信息获取单元还适于:获取用户预设周期内的实时地理位置信息;所述功能判定单元还适于:基于所述用户预设周期内的实时地理位置信息,和所述功能区域的功能,判断与所述用户对应的功能区域。
9.根据权利要求7所述的信息处理装置,其特征在于,所述聚点发现单元包括:窗口半径设置单元、高密度方向计算单元、候选聚点计算单元、分类单元以及聚点确定单元,其中:
所述窗口半径设置单元,适于设置窗口半径数值,基于所述窗口半径数值,分别计算各地理位置信息对应的核密度函数;
所述高密度方向计算单元,适于分别对所述核密度函数求导,判断各实时地理位置信息对应的点的高密度方向;
所述候选聚点计算单元,适于将所述各用户的地理位置信息分别向与其对应的高密度方向移动,直至所述移动位移小于预设值,以得到候选聚点;
所述分类单元对所述候选聚点进行分类,以得到分类的点集合;
所述聚点确定单元,适于选取各个所述分类的点集合的中心位置为所述聚点。
10.根据权利要求9所述的信息处理装置,其特征在于,所述分类单元包括:
初始设置单元、分类距离计算单元、距离比较单元、点集合扩充单元以及点集合新建单元;其中:
所述初始设置单元,设置初始的所述点集合为空集;
所述分类距离计算单元,适于对各个地理位置信息计算分类距离,所述分类距离是当前点集合与所述地理位置信息对应的点的距离;
所述距离比较单元,适于比较所述分类距离中的最小值与预设的距离阈值;
所述点集合扩充单元,适于在所述分类距离中的最小分类距离小于预设的距离阈值时,将该地理位置信息加入所述最小分类距离对应的点集合;
所述点集合新建单元,适于在所述分类距离中的最小分类距离大于预设的距离阈值时,创建新的点集合,该地理位置信息为所述新的点集合的元素。
11.根据权利要求9所述的信息处理装置,其特征在于,所述聚点发现单元还适于利用每个地理位置信息对应的核密度函数值的箱型图,以排除异常点。
12.根据权利要求7所述的信息处理装置,其特征在于,所述功能判定单元还适于参照所述功能区域内的兴趣点,判断所述功能区域的功能。
CN201510673205.0A 2015-10-16 2015-10-16 一种信息处理方法及装置 Active CN105307121B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510673205.0A CN105307121B (zh) 2015-10-16 2015-10-16 一种信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510673205.0A CN105307121B (zh) 2015-10-16 2015-10-16 一种信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN105307121A true CN105307121A (zh) 2016-02-03
CN105307121B CN105307121B (zh) 2019-03-26

Family

ID=55203777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510673205.0A Active CN105307121B (zh) 2015-10-16 2015-10-16 一种信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN105307121B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105813021A (zh) * 2016-05-30 2016-07-27 维沃移动通信有限公司 一种移动终端寻回方法、移动终端及服务器
CN106019340A (zh) * 2016-05-12 2016-10-12 厦门市美亚柏科信息股份有限公司 快速gps定位点获取方法及系统
CN106842258A (zh) * 2017-04-26 2017-06-13 易微行(北京)科技有限公司 一种gps定位系统和汽车
CN107330092A (zh) * 2017-07-04 2017-11-07 广西电网有限责任公司电力科学研究院 一种生产业务噪声数据检测和分离方法
CN107577994A (zh) * 2017-08-17 2018-01-12 南京邮电大学 一种基于深度学习的行人、车辆附属品识别及检索方法
CN109493119A (zh) * 2018-10-19 2019-03-19 南京图申图信息科技有限公司 一种基于poi数据的城市商业中心识别方法及系统
CN109711447A (zh) * 2018-12-19 2019-05-03 武大吉奥信息技术有限公司 一种特殊人群事件预警和监测方法及装置
CN110555544A (zh) * 2019-07-16 2019-12-10 广东工业大学 一种基于gps导航数据的交通需求估计方法
CN110969483A (zh) * 2019-11-29 2020-04-07 支付宝实验室(新加坡)有限公司 一种识别商户位置的方法、装置及电子设备
CN111930756A (zh) * 2020-09-18 2020-11-13 同盾控股有限公司 用于源数据的特征构建方法、装置、电子设备及介质
WO2020258905A1 (zh) * 2019-06-26 2020-12-30 京东数字科技控股有限公司 一种信息推送方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130054602A1 (en) * 2010-05-12 2013-02-28 Nec Corporation Characteristic point detection system, characteristic point detection method, and program
CN103218442A (zh) * 2013-04-22 2013-07-24 中山大学 一种基于移动设备传感器数据的生活模式分析方法及系统
CN104252527A (zh) * 2014-09-02 2014-12-31 百度在线网络技术(北京)有限公司 一种确定移动用户的常驻点信息的方法和装置
US20150052097A1 (en) * 2011-12-29 2015-02-19 Ha Yoon Song Data processing method, data processing device, data collecting method and information providing method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130054602A1 (en) * 2010-05-12 2013-02-28 Nec Corporation Characteristic point detection system, characteristic point detection method, and program
US20150052097A1 (en) * 2011-12-29 2015-02-19 Ha Yoon Song Data processing method, data processing device, data collecting method and information providing method
CN103218442A (zh) * 2013-04-22 2013-07-24 中山大学 一种基于移动设备传感器数据的生活模式分析方法及系统
CN104252527A (zh) * 2014-09-02 2014-12-31 百度在线网络技术(北京)有限公司 一种确定移动用户的常驻点信息的方法和装置

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106019340A (zh) * 2016-05-12 2016-10-12 厦门市美亚柏科信息股份有限公司 快速gps定位点获取方法及系统
CN106019340B (zh) * 2016-05-12 2018-05-29 厦门市美亚柏科信息股份有限公司 快速gps定位点获取方法及系统
CN105813021A (zh) * 2016-05-30 2016-07-27 维沃移动通信有限公司 一种移动终端寻回方法、移动终端及服务器
CN106842258B (zh) * 2017-04-26 2020-05-01 易微行(北京)科技有限公司 一种gps定位系统和汽车
CN106842258A (zh) * 2017-04-26 2017-06-13 易微行(北京)科技有限公司 一种gps定位系统和汽车
CN107330092A (zh) * 2017-07-04 2017-11-07 广西电网有限责任公司电力科学研究院 一种生产业务噪声数据检测和分离方法
CN107577994A (zh) * 2017-08-17 2018-01-12 南京邮电大学 一种基于深度学习的行人、车辆附属品识别及检索方法
CN109493119A (zh) * 2018-10-19 2019-03-19 南京图申图信息科技有限公司 一种基于poi数据的城市商业中心识别方法及系统
CN109711447A (zh) * 2018-12-19 2019-05-03 武大吉奥信息技术有限公司 一种特殊人群事件预警和监测方法及装置
WO2020258905A1 (zh) * 2019-06-26 2020-12-30 京东数字科技控股有限公司 一种信息推送方法和装置
CN110555544A (zh) * 2019-07-16 2019-12-10 广东工业大学 一种基于gps导航数据的交通需求估计方法
CN110555544B (zh) * 2019-07-16 2022-04-08 广东工业大学 一种基于gps导航数据的交通需求估计方法
CN110969483A (zh) * 2019-11-29 2020-04-07 支付宝实验室(新加坡)有限公司 一种识别商户位置的方法、装置及电子设备
CN110969483B (zh) * 2019-11-29 2023-10-10 支付宝实验室(新加坡)有限公司 一种识别商户位置的方法、装置及电子设备
CN111930756A (zh) * 2020-09-18 2020-11-13 同盾控股有限公司 用于源数据的特征构建方法、装置、电子设备及介质
CN111930756B (zh) * 2020-09-18 2021-02-12 同盾控股有限公司 用于源数据的特征构建方法、装置、电子设备及介质

Also Published As

Publication number Publication date
CN105307121B (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
CN105307121A (zh) 一种信息处理方法及装置
Toch et al. Analyzing large-scale human mobility data: a survey of machine learning methods and applications
CN105528359B (zh) 用于存储行进轨迹的方法和系统
CN108427965B (zh) 一种基于路网聚类的热点区域挖掘方法
CN109446186B (zh) 一种基于移动轨迹的社会关系判断方法
CN104462190B (zh) 一种基于海量空间轨迹挖掘的在线的位置预测方法
CN105701123B (zh) 人车关系的识别方法及装置
Wang et al. A visual reasoning approach for data-driven transport assessment on urban roads
Valente et al. Apartment rent prediction using spatial modeling
CN107481511A (zh) 一种计算候选公交站点的方法及系统
CN103533501A (zh) 一种地理围栏生成方法
US11120349B1 (en) Method and system for smart detection of business hot spots
Cesario et al. An approach for the discovery and validation of urban mobility patterns
CN110472999A (zh) 基于地铁和共享单车数据的客流模式分析方法及装置
CN111242352A (zh) 基于车辆轨迹的停等聚集效应预测方法
Shi et al. Detecting spatiotemporal extents of traffic congestion: A density-based moving object clustering approach
Bermingham et al. Mining place-matching patterns from spatio-temporal trajectories using complex real-world places
Lin et al. Noise filtering, trajectory compression and trajectory segmentation on GPS data
Liu et al. POI recommendation method using deep learning in location-based social networks
CN108053646B (zh) 基于时间敏感特征的交通特征获取方法、预测方法及系统
KR101857188B1 (ko) 기계학습기반 부동산 시장 분석 및 예측 장치, 방법 및 컴퓨터 프로그램
CN114007186B (zh) 定位方法及相关产品
CN115408618A (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法
KR101064833B1 (ko) 클러스터링과 특성분석을 이용한 구간 데이터에서 다차원 연관 규칙 마이닝 장치 및 방법
CN111339446B (zh) 一种兴趣点挖掘方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant