CN104661306B - 移动终端被动定位方法及系统 - Google Patents
移动终端被动定位方法及系统 Download PDFInfo
- Publication number
- CN104661306B CN104661306B CN201510094919.6A CN201510094919A CN104661306B CN 104661306 B CN104661306 B CN 104661306B CN 201510094919 A CN201510094919 A CN 201510094919A CN 104661306 B CN104661306 B CN 104661306B
- Authority
- CN
- China
- Prior art keywords
- information
- data
- user
- terminal
- location
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004422 calculation algorithm Methods 0.000 claims description 22
- 230000009471 action Effects 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 18
- 230000004807 localization Effects 0.000 claims description 18
- 230000003542 behavioural effect Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 12
- 230000007613 environmental effect Effects 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims description 7
- 238000000034 method Methods 0.000 abstract description 13
- 238000005516 engineering process Methods 0.000 abstract description 7
- 230000006399 behavior Effects 0.000 description 45
- 230000000875 corresponding effect Effects 0.000 description 34
- 239000002245 particle Substances 0.000 description 7
- 239000000047 product Substances 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 229910000906 Bronze Inorganic materials 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000010974 bronze Substances 0.000 description 1
- KUNSUQLRTQLHQQ-UHFFFAOYSA-N copper tin Chemical compound [Cu].[Sn] KUNSUQLRTQLHQQ-UHFFFAOYSA-N 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 210000003746 feather Anatomy 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- BJORNXNYWNIWEY-UHFFFAOYSA-N tetrahydrozoline hydrochloride Chemical compound Cl.N1CCN=C1C1C2=CC=CC=C2CCC1 BJORNXNYWNIWEY-UHFFFAOYSA-N 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
Abstract
本发明公开了一种移动终端被动定位方法及系统,上述方法包括以下步骤:根据每一条移动终端提交的主动定位服务信息各生成一条主动定位数据,并保存各条生成的主动定位数据,其中,主动定位数据包括用户数据信息以及作为定位结果的位置信息;对于待被动定位的终端,提取该终端对应的用户数据信息,在所生成的主动定位数据的集合中查找用户数据信息和该终端对应的用户数据信息相似度值超过预定阈值的一条或多条主动定位数据;根据查找到的主动定位数据的位置信息确定待被动定位的终端的位置。本发明公开的移动终端被动定位方法及系统,能够解决现有技术中被动定位技术获取用户行为轨迹需要对基站设备进行改造、定位精度有限、可行性不足等问题。
Description
技术领域
本发明涉及数据分析领域,尤其涉及移动终端被动定位方法及系统。
背景技术
随着移动通信网络的发展和移动业务的普及,运营商掌握着广大移动用户的所有用户数据、通信数据和上网数据。在大数据时代,如何利用这些海量数据,为运营商创造出新的价值和利润,成为移动互联网行业当前重要的研究课题和发展方向。其中,利用移动用户行为数据,对用户行为轨迹进行跟踪和统计分析,有利于运营商划分“活动热点”、开展精细化营销,可以帮助政府部门进行流动人口研究、完善城市规划等,具有经济和社会双重利益。
获取移动用户行为轨迹的核心是利用运营商掌握的用户行为数据(包括通信数据和上网数据),定位用户的活动区域(即行为发生区域),通过将这些区域按发生时间进行互联构建行为轨迹,其获取质量取决于对用户行为的定位精度。对移动通信设备的定位是移动通信系统的重要任务之一。按照定位系统的组成分为基于移动台的定位、基于基站的定位和GPS辅助定位等,按照定位方式分为主动定位和被动定位。而移动用户行为定位请求并非由移动设备发起,属于被动定位的范畴。最常见的一类被动定位系统为基站定位,主要是通过被动测量移动设备的辐射信号参数来对目标进行定位,这些参数主要包括目标信号的到达角(AOA)、到达时间差(DTOA)和多普勒频率(FD)等。在通信定位中,主要应用的是基于AOA和基于DTOA的定位方式。前者由基站通过阵列天线测出移动信号的入射角,从而形成了从基站到移动台的径向连线,在二维平面上,多个基站就有多根这样的射线,其焦点就是移动设备的位置。后者考虑到移动设备和两个基站之间存在的一定距离差,因此利用移动设备反馈信号到两个基站时存在时间差计算出移动设备的估计位置。在二维平面上移动设备位于以两个基站为焦点的双曲线上,因此三个基站形成两条相交的双曲线就可以确定移动设备的估计位置。
然而在移动用户行为轨迹获取的过程中,运营商掌握的数据主要包括移动用户的用户数据和行为数据,如果采用现有基于基站的被动定位方式将存在以下弊端:
首先,由于被动定位系统的定位方式和数据类型都有很大局限性,相较于主动定位,被动定位技术尚不够成熟,精度存在较大差距。
其次,现有技术需要多基站协同工作,即各个基站除了执行通信服务外还必须实时对用户进行定位工作,此种方法严重增加了通信基站的工作负担。虽然对某个指定的移动终端而言,通过现有技术进行实时定位跟踪具有很高的精度,然而移动用户行为轨迹获取的重点在于对用户行为轨迹的信息统计,而非移动用户的个体行为跟踪。随着移动终端数量的增长,每个基站需要同时定位多个终端,并且执行非常复杂的定位算法,其工作量、计算量以及需要存储的数据量几乎是不可实现的。
另一方面,如果为了减少计算存储量,可以直接应用运营商掌握的用户行为数据中用户行为发生的基站位置(Cell ID)作为用户的位置信息。这种基于Cell ID的单基站定位精度主要取决于本地区的基站分布情况及其无线环境,但在偏远地区其定位误差已超过5000米,对整个用户行为轨迹获取而言将会造成不可忽略的误差。
综上可知,通过现有被动定位技术获取移动用户行为轨迹不仅需要对基站设备进行相关改造,而且其计算存储量过大、精度有限,可行性受到质疑。
发明内容
本发明提供一种移动终端被动定位方法及系统,用来解决现有技术中被动定位技术获取移动用户行为轨迹需要对基站设备进行改造、定位精度有限、可行性不足等问题。
为了解决上述技术问题,本发明提供一种移动终端被动定位方法,包括以下步骤:根据每一条移动终端提交的主动定位服务信息各生成一条主动定位数据,并保存各条生成的主动定位数据,其中,所述主动定位数据包括用户数据信息以及作为定位结果的位置信息;对于待被动定位的终端,提取该终端对应的用户数据信息,在所生成的主动定位数据的集合中查找用户数据信息和该终端对应的用户数据信息相似度值超过预定阈值的一条或多条主动定位数据;根据查找到的主动定位数据的位置信息确定待被动定位的终端的位置。
进一步地,所述用户数据信息包括用户信息、行为信息以及上下文信息。
进一步地,所述主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值由以下任一方式进行计算:余弦相似度、皮尔森相似系数、Jaccard相似系数、皮尔逊积差系数。
进一步地,根据查找到的主动定位数据的位置信息确定待被动定位的终端的位置包括:根据查找到的主动定位数据的位置信息,采用质心定位算法确定待被动定位的终端的位置,其中,以查找到的主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值为质心定位算法中的权重系数。
进一步地,所述移动终端被动定位方法,还包括:根据主动定位数据的位置信息及待被动定位的终端的位置信息,按照时间顺序获取相应移动用户的行为轨迹。
本发明还提供一种移动终端被动定位系统,包括:第一数据处理模块,用于根据每一条移动终端提交的主动定位服务信息各生成一条主动定位数据,并保存各条生成的主动定位数据,其中,所述主动定位数据包括用户数据信息以及作为定位结果的位置信息;第二数据处理模块,用于对于待被动定位的终端,提取该终端对应的用户数据信息,在所生成的主动定位数据的集合中查找用户数据信息和该终端对应的用户数据信息相似度超过预定阈值的一条或多条主动定位数据;位置确定模块,用于根据查找到的主动定位数据的位置信息确定待被动定位的终端的位置。
进一步地,所述用户数据信息包括用户信息、行为信息以及上下文信息。
进一步地,所述主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值由以下任一方式进行计算:余弦相似度、皮尔森相似系数、Jaccard相似系数、皮尔逊积差系数。
进一步地,所述位置确定模块,用于根据查找到的主动定位数据的位置信息,采用质心定位算法确定待被动定位的终端的位置,其中,以查找到的主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值为质心定位算法中的权重系数。
进一步地,所述移动终端被动定位系统,还包括轨迹获取模块,用于根据主动定位数据的位置信息及待被动定位的终端的位置信息,按照时间顺序获取相应移动用户的行为轨迹。
本发明提供的移动终端被动定位方法及系统,基于移动用户的相似度利用已知的主动定位数据进行被动定位。在不增加运营商成本负担的前提下,利用现有数据,结合移动用户的主动定位信息,提高被动定位精度,从而保证获取的移动用户行为轨迹具有真实性和可行性。
附图说明
图1所示为本发明较佳实施例提供的移动终端被动定位方法的流程图;
图2所示为本发明较佳实施例提供的质心定位算法的示意图;
图3所示为本发明较佳实施例提供的移动终端被动定位系统的示意图。
具体实施方式
如图1所示,本发明较佳实施例提供的移动终端被动定位方法包括以下步骤:S1:根据每一条移动终端提交的主动定位服务信息各生成一条主动定位数据,并保存各条生成的主动定位数据,其中,所述主动定位数据包括用户数据信息以及作为定位结果的位置信息;S2:对于待被动定位的终端,提取该终端对应的用户数据信息,在所生成的主动定位数据的集合中查找用户数据信息和该终端对应的用户数据信息相似度值超过预定阈值的一条或多条主动定位数据;S3:根据查找到的主动定位数据的位置信息确定待被动定位的终端的位置。
于较佳实施例中,用户数据信息包括用户信息、行为信息以及上下文信息。
于较佳实施例中,主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值由以下任一方式进行计算:余弦相似度、皮尔森相似系数、Jaccard相似系数、皮尔逊积差系数。
于较佳实施例中,根据查找到的主动定位数据的位置信息确定待被动定位的终端的位置包括:根据查找到的主动定位数据的位置信息,采用质心定位算法确定待被动定位的终端的位置,其中,以查找到的主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值为质心定位算法中的权重系数。
于较佳实施例中,移动终端被动定位方法,还包括:根据主动定位数据的位置信息及待被动定位的终端的位置信息,按照时间顺序获取相应移动用户的行为轨迹。
具体而言,根据现有基站架构,利用运营商的基站数据可以将移动用户行为发生地定位到某一个基站cell ID区域内。而在该区域内用户的行为可分为两类,一类已知用户行为而未知其行为发生的地理位置,另一类既知道发生的行为又确定行为发生的具体地理位置。针对后者,现有的主动定位技术已达到足够的精度。通过心理学研究表明,移动用户作为一类有感知的个体,其行为具有类聚性,即所谓的“物以类聚,人以群分”。这也意味着移动用户间的用户背景越相似、行为属性越一致、周围环境越相近,其出现在同一地理位置的可能性越大。例如,25-30岁的女白领周末的下午时段大多出现在商场,40-50岁的成功男士周末的下午时段出现在咖啡厅的概率更高;下雨天用户大多在室内活动;用户在中午或晚饭时间主要集中在餐馆等等。
基于以上假设,以下对本发明较佳实施例提供的方法进行详细描述。
于本实施例中,用户数据信息包括用户信息、行为信息以及上下文信息。
于此,用户信息包括用户标识(ID)、用户等级、用户标签以及用户自身信息。其中,用户ID即用户手机号码生成的ID号,用户ID作为用户唯一标识;用户等级是根据用户消费记录对用户价值的排序,例如VIP用户、金牌用户、银牌用户、铜牌用户等;用户标签是根据用户行为记录分析其喜好匹配对应的行为喜好标签,例如包括:购物、工作、KTV、美食等;用户自身信息包括用户年龄、性别、教育背景和收入等。具体而言,用户信息可通过运营商客户关系管理(CRM)系统获取,用户在注册手机号码时登记自身信息,运营商CRM系统对各用户ID的用户行为进行记录,并可根据记录的用户行为进行数据挖掘从而对用户行为喜好进行标签分类,根据用户消费行为记录确定用户等级。
于此,行为信息及上下文信息例如从运营商掌握的用户详单数据中提取。具体而言,用户详单数据包括上网数据和通信数据。其中,上网数据为移动用户上网流量详单数据,包括用户ID、上网时长、上网类型(3G或2G)、访问内容、信号强度和基站Cell ID以及上下文信息。上下文信息包括时间信息、环境信息及天气信息。通信数据为移动用户通信详单数据,包括用户ID、通话时长、通信类型(市内/长途/国际长途)、通话对象(即被通话人为常用联系人、工作号码、家庭号码或其他)、信号强度和基站Cell ID、以及上下文信息。其中,上下文信息包括时间信息、环境信息、天气信息及状态信息。
于此,主动定位服务信息包括请求定位服务的移动用户的位置信息。例如,用户打开GPS上网搜索周围的美食,则生成一条对应的主动定位服务信息,所述主动定位服务信息具体包括:用户ID,服务类型(上网或通话)、服务内容(访问的网站或通话对象)、位置信息(经纬度)和基站Cell ID以及上下文信息。其中,上下文信息包括时间信息、环境信息及天气信息。
上述用户的上下文信息可以利用移动终端的传感器技术以及接收到的信令数据获得。其中,时间信息例如划分为工作日、节假日、特殊日期三个大维度,每个维度上将一天24小时划分为48个区间,每个区间半小时;环境信息是指用户行为发生的环境状态(如安静、正常音量、吵闹、喧嚣等);天气信息是指用户行为发生的天气情况(如阴、晴、雨、霾等);状态信息指用户当前的状态(如闲暇、无聊、忙碌、不紧不慢等)。
在进行被动定位前需要对上述用户数据进行信息的匹配、整合及量化。由于每类数据中均包含了用户ID,因而以用户ID为索引将用户所有数据整合成两类,分别为待定位数据和主动定位数据。并且,按照基站Cell ID进行分类存储,供后续调用。
当已知用户的通信或上网行为而未知其行为发生位置时,将用户信息与上网数据和通信数据进行匹配,整合成待定位数据。
具体而言,首先提取出同一个基站Cell ID下,即在此基站下发生的所有行为对应的用户信息和行为信息(包括通信行为数据和上网行为数据),利用用户ID进行关联匹配,例如表1所示。
表1
如表1所示,经整合后,每一条待定位数据包括用户信息、行为信息和上下文信息三大类别,每个类别下又包含多个子维度。其中,行为信息由用户的上网数据和通信数据整合而成,包含三个维度(行为、时长、内容)。行为维度包括3gnet(3G上网)、2gnet(2G上网)、wifi、市话、国际长途、国内长途等上网或通话类别;时长维度为用户此次上网或通话的时长;内容维度为上网访问的应用类型或者通话对象的类别。用户信息例如包括四个维度(用户等级、标签、性别、年龄),其中,用户等级维度例如包括第1至5个用户消费记录等级;标签维度例如包括购物、工作、美食、KTV等用户行为喜好;性别维度包括男性、女性两个类别;年龄维度为用户的年龄数据。上下文信息例如包括三个维度(时间、环境、天气),其中,时间维度为用户此次上网或通话行为的发生时间;环境维度为此次用户行为发生时的环境状况,例如包括安静、吵闹、喧闹、正常音量等;天气维度为此次用户行为发生时的天气情况,例如包括阴、晴、雨等。
接下来,对整合的待定位数据中的数据进行量化处理。其中,对于非数字信息进行离散化表示,以用户标签为例,假设总共设置了A个用户标签,则每个标签类别唯一对应1~A中的一个数字。同样地,用户性别维度、行为维度、内容维度、环境维度及天气维度的量化有类似的处理方式。对于具有单位属性的数字信息进行无纲量处理,以时间信息为例,可以将一天24小时等量划分为48个区间,每个区间半小时,依次对应1~48中的一个数字。类似地,针对用户年龄,按照0~10岁对应数字1,11~20岁对应数字2,进行递推,例如,25岁对应数字为3。
经以上匹配、整合及量化处理后,某基站Cell ID下存储的待定位数据例如表2所示。
表2
同理,当已知用户主动定位服务信息时,将用户信息、用户详单数据及主动定位服务信息进行匹配、整合及量化后,得到主动定位数据,例如表3所示。
表3
其中,主动定位数据中的用户信息、行为信息和上下文信息三个维度的表示方式及量化方式与待定位数据类似,且主动定位数据及待定位数据的属性维度及空间的划分方式必须保持一致。主动定位数据的位置信息以经纬度的方式记录用户当前行为发生的具体地理位置。
接着对上述待定位数据进行被动定位,即补充待定位数据中每条记录的位置信息。考虑到用户特征的相似性,特征越相似的用户其地理位置越相近,而用户的主动定位数据已经具备一定的可靠性保证。具体而言,针对任意一条待定位数据,首先计算出其与每条主动定位数据的相似度值,查找出符合预定阈值(相似度阈值)的M条主动定位数据。其中,参数M为非固定的整数值,由设置的预定阈值决定。接下来,利用这M条主动定位数据的位置信息和与该待定位数据的相似度值,以相似度值为权重系数,采用质心定位算法估计出该待定位数据对应的位置信息。
具体而言,相似度度量(Similarity),即计算个体间的相似程度,相似度度量的值越小,说明个体间相似度越小,差异越大。于本实施例中,使用余弦相似度计算待定位数据x和主动定位数据y的特征相似度值,如公式1。
(公式1)
其中,参数N为待定位数据的特征维度。
上述公式中涉及的特征维度包括用户信息、行为信息以及上下文信息的所有维度。以表2中第一条待定位数据和表3中第一条主动定位数据为例,两者之间的特征相似度值为(4×2+2×1+1×3+3×4+1×4+8×18+4×2+19×29+1×1+2×1)/((16+4+1+9+1+64+16+361+1+4)×(4+1+9+16+16+324+4+841+1+1))=0.001266。
其中,余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小,其取值在0和1之间,相似度值越大表示相似度越高。在此,设置相似度阈值0≤δ≤1,当sim(x,y)≥δ时,提取出主动定位数据y的位置信息和相似度值θy,记为<y,(αy,βy),θy>,其中,位置坐标(αy,βy)表示地理位置的经度和纬度值。针对待定位数据x,在主动定位数据表中查找出所有符合条件(相似度值的预定阈值)的数据集合YX,采用质心算法进行下一步位置估计。
于本实施例中,采用余弦相似度计算移动用户之间的相似度值。然而,本发明对此并不限定。于其他实施例中,可以采用其他相似度计算公式如皮尔森相关系数、Jaccard相似系数、皮尔逊积差系数等。
于本实施例中,获取相似度值符合预定阈值的主动定位数据的集合后,采用质心定位算法预测待定位数据的地理位置。其中,质心算法的原理是:待定位节点通过接收附近锚节点所发出的位置信息,并根据所接收到的锚节点位置信息求取这些锚节点的质心,将所求得的质心作为待定位节点的位置。然而,本发明对此并不限定。于其他实施例中,可以采用其他估计方法,例如ML最大释然法、MAP最大后验概率法、MSE最小均方误差等。
于本实施例中,将待定位数据与主动定位数据的相似度值作为权重系数代入质心定位算法中从而解算出待定位节点的坐标。具体描述如下:将数据集合YX中的数据值表示在以经度信息α和纬度信息β张开的坐标系下。如图2所示,经度信息α例如为横坐标,纬度信息β例如为纵坐标,假设该数据集合YX共有M条数据,则每个数据点对应于坐标系下的唯一一点。进一步地,将这些地理位置已知的数据看成“质点”,其质心即为本实施例需要求解的待定位节点的坐标。质点与质心的距离由其相似度值θ决定,θ越大则该质点与质心距离越近。因而,本实施例所采用的质心定位算法将以θ作为权重系数,θ越大的质点坐标位置在估值过程中所占的权重越大。本实施例中,质心定位算法求解待定位节点位置的计算公式如公式2。
(公式2)
其中,θt表示的是第t个质点与待定位节点的相似度值,(αt,βt)表示的是第t个质点的位置坐标。
通过上述步骤,可以得到每一个基站Cell ID下每条待定位数据对应的位置信息。接下来,将所有主被动定位数据中的位置信息按照时间顺序展示在城市地图上,即完成了相应移动用户的行为轨迹获取。
于本实施例中,根据实际需要将分别统计工作日、节假日以及特殊日期的移动用户行为轨迹。以工作日为例,针对任意一个用户ID,提取出每日行为记录对应的位置信息,根据其行为发生的具体时间刻画出该用户每个工作日24小时内的行为轨迹。针对所有行为轨迹通过统计学方法进一步处理拟合成一条该用户工作日行为轨迹曲线。具体的拟合方法可以直接采用origin或者matlab中相关拟合工具实现。进一步地,可根据需求进行相关应用扩展。例如分析所有移动用户的行为轨迹曲线的共性,从而按照时间段寻找移动热点进行区域营销;研究移动用户行为的差异性可助于识别异常用户,排除安全隐患等等。
如图3所示,本实施例提供的移动终端被动定位系统,包括第一数据处理模块104、第二数据处理模块105以及位置确定模块106。第一数据处理模块104,用于根据每一条移动终端提交的主动定位服务信息各生成一条主动定位数据,并保存各条生成的主动定位数据,其中,所述主动定位数据包括用户数据信息以及作为定位结果的位置信息;第二数据处理模块105,用于对于待被动定位的终端,提取该终端对应的用户数据信息,在所生成的主动定位数据的集合中查找用户数据信息和该终端对应的用户数据信息相似度超过预定阈值的一条或多条主动定位数据;位置确定模块106,用于根据查找到的主动定位数据的位置信息确定待被动定位的终端的位置。
于较佳实施例中,用户数据信息包括用户信息、行为信息以及上下文信息。
于较佳实施例中,主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值由以下任一方式进行计算:余弦相似度、皮尔森相似系数、Jaccard相似系数、皮尔逊积差系数。
于较佳实施例中,位置确定模块106,用于根据查找到的主动定位数据的位置信息,采用质心定位算法确定待被动定位的终端的位置,其中,以查找到的主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值为质心定位算法中的权重系数。
于较佳实施例中,移动终端被动定位系统,还包括轨迹获取模块107,用于根据主动定位数据的位置信息及待被动定位的终端的位置信息,按照时间顺序获取相应移动用户的行为轨迹。
于较佳实施例中,移动终端被动定位系统,还包括客户关系管理(CRM)模块101、采集模块102以及存储模块103。具体而言,采集模块102,用于采集用户详单数据以及移动终端提交的主动定位服务信息;客户关系管理模块101,用于注册并记录用户信息。存储模块103,用于将采集模块102及客户关系管理模块101获取或记录的信息进行分类存储,例如按照基站Cell ID存储为用户信息、上网数据、通信数据以及主动定位服务信息。于此,第一数据处理模块104用于按照用户ID从存储模块103提取出对应的用户信息、所有上网和通信行为数据以及主动定位服务数据,经整合和量化后,生成并保存主动定位数据。第二数据处理模块105,用于从存储模块103提取待被动定位的终端对应的用户数据信息,在第一数据处理模块104生成的主动定位数据的集合中查找用户数据信息和待被动定位的终端对应的用户数据信息相似度超过预定阈值的M条主动定位数据。其中,M为大于或等于1的整数。位置确定模块106,用于根据第二数据处理模块105查找到的主动定位数据的位置信息确定待被动定位的终端的位置。轨迹获取模块107,用于结合主被动定位数据的位置信息刻画出相应移动用户的行为轨迹,其中,包括移动用户日常行为轨迹(工作日)、节假日行为轨迹以及特殊日期行为轨迹(根据需求可对某些特定日期进行轨迹刻画)。
此外,关于上述系统的具体操作过程同上述方法所述,故于此不再赘述。
综上所述,本发明较佳实施例将移动用户数据分为两类,待定位数据和主动定位数据,通过计算两者间的用户相似度,构造相似用户集合,继而利用主动定位数据预测待定位数据的位置坐标。如此,既不会造成任何硬件成本,又充分利用了主动定位技术的精度优势,相较于直接的基站定位,可以有效剔除可能性低的点,删选出可能性高的点,缩小被动定位区域范围,大大提高了定位精度并具有充分的可行性。而且,在本发明较佳实施例中,将主动定位数据看成地理位置已知的“质点”,采用以相似度值为权重的改进质心定位算法对待估计节点的位置坐标进行预测,相似度值越大,质心离该质点的距离越近。如此,利用质心定位技术将移动用户的相似性直接体现在最终的地理坐标的求解上,进一步保证了定位精度。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
Claims (8)
1.一种移动终端被动定位方法,其特征在于,包括以下步骤:
根据每一条移动终端提交的主动定位服务信息各生成一条主动定位数据,并保存各条生成的主动定位数据,其中,所述主动定位数据包括用户数据信息以及作为定位结果的位置信息,所述用户数据信息包括用户信息、行为信息以及上下文信息;
对于待被动定位的终端,提取该终端对应的用户数据信息,在所生成的主动定位数据的集合中查找用户数据信息和该终端对应的用户数据信息相似度值超过预定阈值的一条或多条主动定位数据;
根据查找到的主动定位数据的位置信息确定待被动定位的终端的位置;
其中,所述用户信息包括用户标识、用户等级、用户标签以及用户自身信息;所述行为信息由用户的上网数据和通信数据整合而成,包含三个维度:行为、时长和内容;所述上下文信息包括时间信息、环境信息及天气信息。
2.如权利要求1所述的移动终端被动定位方法,其特征在于:所述主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值由以下任一方式进行计算:余弦相似度、皮尔森相似系数、Jaccard相似系数、皮尔逊积差系数。
3.如权利要求1所述的移动终端被动定位方法,其特征在于:根据查找到的主动定位数据的位置信息确定待被动定位的终端的位置包括:根据查找到的主动定位数据的位置信息,采用质心定位算法确定待被动定位的终端的位置,其中,以查找到的主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值为质心定位算法中的权重系数。
4.如权利要求1所述的移动终端被动定位方法,其特征在于,还包括:根据主动定位数据的位置信息及待被动定位的终端的位置信息,按照时间顺序获取相应移动用户的行为轨迹。
5.一种移动终端被动定位系统,其特征在于,包括:
第一数据处理模块,用于根据每一条移动终端提交的主动定位服务信息各生成一条主动定位数据,并保存各条生成的主动定位数据,其中,所述主动定位数据包括用户数据信息以及作为定位结果的位置信息,所述用户数据信息包括用户信息、行为信息以及上下文信息;
第二数据处理模块,用于对于待被动定位的终端,提取该终端对应的用户数据信息,在所生成的主动定位数据的集合中查找用户数据信息和该终端对应的用户数据信息相似度超过预定阈值的一条或多条主动定位数据;
位置确定模块,用于根据查找到的主动定位数据的位置信息确定待被动定位的终端的位置;
其中,所述用户信息包括用户标识、用户等级、用户标签以及用户自身信息;所述行为信息由用户的上网数据和通信数据整合而成,包含三个维度:行为、时长和内容;所述上下文信息包括时间信息、环境信息及天气信息。
6.如权利要求5所述的移动终端被动定位系统,其特征在于:所述主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值由以下任一方式进行计算:余弦相似度、皮尔森相似系数、Jaccard相似系数、皮尔逊积差系数。
7.如权利要求5所述的移动终端被动定位系统,其特征在于:所述位置确定模块,用于根据查找到的主动定位数据的位置信息,采用质心定位算法确定待被动定位的终端的位置,其中,以查找到的主动定位数据的用户数据信息与待被动定位的终端对应的用户数据信息的相似度值为质心定位算法中的权重系数。
8.如权利要求5所述的移动终端被动定位系统,其特征在于:还包括轨迹获取模块,用于根据主动定位数据的位置信息及待被动定位的终端的位置信息,按照时间顺序获取相应移动用户的行为轨迹。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510094919.6A CN104661306B (zh) | 2015-03-03 | 2015-03-03 | 移动终端被动定位方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510094919.6A CN104661306B (zh) | 2015-03-03 | 2015-03-03 | 移动终端被动定位方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104661306A CN104661306A (zh) | 2015-05-27 |
CN104661306B true CN104661306B (zh) | 2019-01-11 |
Family
ID=53251879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510094919.6A Active CN104661306B (zh) | 2015-03-03 | 2015-03-03 | 移动终端被动定位方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104661306B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105246157B (zh) * | 2015-11-03 | 2019-05-10 | 中国联合网络通信集团有限公司 | 一种移动终端的定位方法和定位系统 |
CN105868620B (zh) * | 2016-03-23 | 2019-02-05 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN106123897B (zh) * | 2016-06-14 | 2019-05-03 | 中山大学 | 基于多特征的室内融合定位方法 |
CN108256035A (zh) * | 2018-01-11 | 2018-07-06 | 汤凯 | 一种工业场所危险行为识别系统 |
CN109005513B (zh) * | 2018-06-26 | 2021-03-19 | 北京酷云互动科技有限公司 | 手机终端关联方法和手机终端关联系统 |
CN110351697A (zh) * | 2019-08-16 | 2019-10-18 | 深圳创维-Rgb电子有限公司 | 移动终端找寻方法、智能电视及计算机可读存储介质 |
CN112004192A (zh) * | 2020-09-03 | 2020-11-27 | 中国联合网络通信集团有限公司 | 基站定位方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103202003A (zh) * | 2010-10-05 | 2013-07-10 | 高通股份有限公司 | 使用环境信息的移动装置位置估计 |
CN103227821A (zh) * | 2013-04-03 | 2013-07-31 | 腾讯科技(深圳)有限公司 | 一种目标用户位置数据的处理方法及装置 |
CN103973724A (zh) * | 2013-01-25 | 2014-08-06 | 索尼公司 | 社交网络的组网方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8660582B2 (en) * | 2011-09-20 | 2014-02-25 | Steve Y. Chen | System and method for electronic communications between users in a similar geographic location |
-
2015
- 2015-03-03 CN CN201510094919.6A patent/CN104661306B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103202003A (zh) * | 2010-10-05 | 2013-07-10 | 高通股份有限公司 | 使用环境信息的移动装置位置估计 |
CN103973724A (zh) * | 2013-01-25 | 2014-08-06 | 索尼公司 | 社交网络的组网方法和装置 |
CN103227821A (zh) * | 2013-04-03 | 2013-07-31 | 腾讯科技(深圳)有限公司 | 一种目标用户位置数据的处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104661306A (zh) | 2015-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104661306B (zh) | 移动终端被动定位方法及系统 | |
EP3471374B1 (en) | Method and device for identifying type of geographic location at where user is located | |
CN111737605A (zh) | 一种基于手机信令数据的出行目的识别方法及装置 | |
CN109189949B (zh) | 一种人口分布计算方法 | |
CN105243148A (zh) | 一种基于签到数据的时空轨迹相似性度量方法及系统 | |
CN106339769B (zh) | 一种面向移动社会网络的用户出行预测方法 | |
CN103634901A (zh) | 基于核密度估计的新型定位指纹采集提取方法 | |
CN108875584A (zh) | 一种基于无线感知的高可靠用户行为识别方法 | |
CN109902681B (zh) | 用户群体关系确定方法、装置、设备及存储介质 | |
JP6169022B2 (ja) | 携帯端末を所持したユーザの滞在地を推定する装置、プログラム及び方法 | |
CN108566620A (zh) | 一种基于wifi的室内定位方法 | |
CN111400747B (zh) | 一种基于轨迹隐私保护的度量方法 | |
CN109977324A (zh) | 一种兴趣点挖掘方法及系统 | |
CN104320848A (zh) | 基于云计算实现室内定位的系统及方法 | |
Solmaz et al. | Group-in: Group inference from wireless traces of mobile devices | |
Zhang et al. | The enhancement of WiFi fingerprint positioning using convolutional neural network | |
CN111782980B (zh) | 地图兴趣点的挖掘方法、装置、设备及存储介质 | |
Terroso-Sáenz et al. | Human mobility prediction with region-based flows and water consumption | |
Frias-Martinez et al. | Sensing urban land use with twitter activity | |
Zhang et al. | Identifying logical location via GPS-enabled mobile phone and wearable camera | |
Husen et al. | High performance indoor location Wi-Fi fingerprinting using invariant received signal strength | |
Mateos et al. | Spatiotemporal accuracy in mobile phone location: Assessing the new cellular geography | |
Shahid et al. | Images based indoor positioning using AI and crowdsourcing | |
US10996310B2 (en) | Estimated user location from cellular telephony data | |
Xie et al. | Hot time periods discovery for facility proportioning in urban commercial districts using POIs and mobile phone data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |