CN107133689B - 一种位置标记方法 - Google Patents

一种位置标记方法 Download PDF

Info

Publication number
CN107133689B
CN107133689B CN201710257267.2A CN201710257267A CN107133689B CN 107133689 B CN107133689 B CN 107133689B CN 201710257267 A CN201710257267 A CN 201710257267A CN 107133689 B CN107133689 B CN 107133689B
Authority
CN
China
Prior art keywords
wireless
type
types
aps
unknown
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710257267.2A
Other languages
English (en)
Other versions
CN107133689A (zh
Inventor
王智
赵莉婷
袁小燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Tsinghua University
Original Assignee
Shenzhen Graduate School Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Tsinghua University filed Critical Shenzhen Graduate School Tsinghua University
Priority to CN201710257267.2A priority Critical patent/CN107133689B/zh
Publication of CN107133689A publication Critical patent/CN107133689A/zh
Application granted granted Critical
Publication of CN107133689B publication Critical patent/CN107133689B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种位置标记方法,包括:获取待标记位置包含的所有无线AP,所有无线AP包括未知类型的无线AP和已知类型的无线AP;分别提取各个无线AP的地理邻域特征;分别提取各个无线AP的用户行为特征;根据各个无线AP的地理邻域特征和各个无线AP的用户行为特征,预测得到未知类型的无线AP的类型;根据所有无线AP的类型来对所述待标记位置进行标记。本发明提出的位置标记方法,实现精确地对位置进行标记。

Description

一种位置标记方法
技术领域
本发明涉及无线通讯领域,尤其涉及一种位置标记方法。
背景技术
随着智能设备的普及、人类生活半径的扩大,使得用户需要更详细、更准确的位置信息,一些相关的应用,比如室内导航、内容推荐等类型的应用也都需要精确的位置信息标记。
现有的位置标记不能细粒度地描述该位置的功能,主要体现在以下方面:(1)传统的位置标记主要根据用户行为进行分析,通常是基于在线社交网络用户的定位数据来分析某个位置的用户行为,从而根据用户行为特点来判断某个位置的功能。这种方式的数据量有限,因为用户并不总是会定位自己所在的位置,从而导致能提取出的用户行为不明显或者缺失;(2)传统位置标记也会根据地理环境来做出判断,但这些方法都只考虑地理位置相似性或者只考虑用户行为相似性,使得位置标记不够准确;(3)标记的地理范围通常比较大,不能精细的标记一个位置,比如一个商场中的某一层的某一个店铺。
以上背景技术内容的公开仅用于辅助理解本发明的构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
为解决上述技术问题,本发明提出一种位置标记方法,实现精确地对位置进行标记。
为了达到上述目的,本发明采用以下技术方案:
本发明公开了一种位置标记方法,包括以下步骤:
S1:获取待标记位置包含的所有无线AP,所有无线AP包括未知类型的无线AP和已知类型的无线AP;
S2:分别提取各个无线AP的地理邻域特征;
S3:分别提取各个无线AP的用户行为特征;
S4:根据各个无线AP的地理邻域特征和各个无线AP的用户行为特征,预测得到未知类型的无线AP的类型;
S5:根据所有无线AP的类型来对所述待标记位置进行标记。
优选地,步骤S2中无线AP的地理邻域特征是指在无线AP所在的预设区域内的所有已知类型的无线AP的类型。
优选地,其中无线AP所在的预设区域是指以所述无线AP为中心,100~200米为半径的区域内。
优选地,步骤S3中无线AP的用户行为特征是指访问过该无线AP的所有用户访问过的所有已知类型的无线AP的类型。
优选地,步骤S3具体包括:首先对所有用户在不同时间段内访问过的已知类型的无线AP的类型进行统计,得到每个用户的行为特征;然后提取访问过某一无线AP的所有用户,将访问该无线AP的所有用户的行为特征作为该无线AP的用户行为特征。
优选地,其中的不同时间段是以每两小时为一段,将时间划分为不同时间段。
优选地,步骤S4具体包括:将无线AP的地理邻域特征和无线AP的用户行为特征分别赋予预设的权重作为输入特征,基于机器学习方法,通过学习已知类型的无线AP的特征来预测得到未知类型的无线AP的类型。
优选地,基于所述机器学习方法具体为基于决策树的AdaBoost算法。
与现有技术相比,本发明的有益效果在于:本发明公开了一种位置标记方法,通过判断该位置区域内的无线AP的类型来详细了解该位置的功能,无线AP的数据集比较密集,从而使得从中提取出来的用户行为特征具有很强的代表性,位置标记精确细致,并且充分利用无线AP的地理邻域特征,提升准确率;其中通过地理邻域特征和用户行为特征的结合,保证了无线AP类型的预测的准确性,从而进一步确保了位置标记的准确性。
在进一步的方案中,本发明进一步采用机器学习方法对无线AP的类型进行预测,并采用基于决策树的AdaBoost算法,将该算法结合无线AP的地理邻域特征和用户行为特征,大大提升无线AP预测的准确率。
附图说明
图1是本发明优选实施例的位置标记方法的流程示意图;
图2是本发明优选实施例的位置标记方法中的机器学习方法的训练流程示意图。
具体实施方式
下面对照附图并结合优选的实施方式对本发明作进一步说明。
如图1所示,本发明优选实施例公开了一种位置标记方法,包括以下步骤:
S1:获取待标记位置包含的所有无线AP(Acess Point,接入点),所有无线AP包括未知类型的无线AP和已知类型的无线AP;
S2:分别提取各个无线AP的地理邻域特征;
具体地,无线AP的地理邻域特征是指在无线AP所在的预设区域内的所有已知类型的无线AP的类型,其中无线AP所在的预设区域是指以所述无线AP为中心,100~200米为半径的区域内,即处于无线AP的信号覆盖范围内。
S3:分别提取各个无线AP的用户行为特征;
其中无线AP的用户行为特征是指访问过该无线AP的所有用户访问过的所有已知类型的无线AP的类型;具体地,首先对所有用户在不同时间段内访问过的已知类型的无线AP的类型进行统计,得到每个用户的行为特征,然后提取访问某一无线AP的所有用户,将访问该无线AP的所有用户的行为特征作为该无线AP的用户行为特征;其中不同时间段是以每两小时为一段,将时间划分为不同时间段,以对所有用户在每段不同时间段内访问过的已知类型的无线AP的类型进行统计。
S4:根据各个无线AP的地理邻域特征和各个无线AP的用户行为特征的相似性,预测得到未知类型的无线AP的类型;
具体地,将无线AP的地理邻域特征和无线AP的用户行为特征分别赋予预设的权重作为输入特征,基于机器学习方法,通过学习已知类型的无线AP的特征来预测得到未知类型的无线AP的类型;其中,基于机器学习方法为基于决策树的AdaBoost算法。
在本发明实施例中,需要采用已知类型的无线AP来提前对AdaBoost算法进行训练,结合图2所示,训练的具体步骤为:
a1:数据收集步骤:首先收集POI(Point ofInternet,信息点)位置数据集和Wi-Fi连接数据集,将两类数据集进行数据整合,并进行清洗数据等数据预处理操作,然后分为两个子数据集,其中一个子数据集为已知类型的无线AP,另一个子数据集为未知类型的无线AP,其中在数据集中还包括经纬度(无线AP的地理位置)、访问用户(访问过无线AP的所有用户)、访问时间(对应用户访问的时间)等信息;其中将已知类型的无线AP的子数据集用于训练,未知类型的无线AP的子数据集用于测试。
a2:特征提取步骤:分别从两个子数据集中提取特征:包括无线AP的用户访问特征和地理邻域特征,提取步骤同上述步骤S2和S3。
a3:类型预测步骤:采用基于决策树的AdaBoost算法进行训练,然后在用于测试的子数据集中进行预测,输出最后的无线AP类型。其中在针对无线AP的类型预测,可能会有多个类型的可能性,如(类型1,概率1)、(类型2,概率2)……最后选取概率最大的对应的类型作为该无线AP的最终预测的类型。
S5:根据所有无线AP的类型来对所述待标记位置进行标记,即位置标记就是将这个位置内的每个无线AP类型显示出来即可。
本发明优选实施例可以应用于未知的地理区域,通过判断该区域内的无线AP类型,用户可以详细地连接该区域的功能。根据本发明优选实施例,当用户想要了解某个区域的功能,分类系统首先获取该区域内的所有的无线AP及其相关信息;然后对每个无线AP提取其地理邻域特征,即该无线AP周围的无线AP类型分布,再提取每个无线AP的用户行为特征,即访问过该无线AP的用户在不同时间段内访问过的无线AP的类型分布;再结合无线AP的地理邻域特征和无线AP的用户行为特征,分别赋予相应的权重,利用机器学习方法,得出每个无线AP属于不同类型的概率,取最大概率对应的类型,即为相应的无线AP的类型;最后根据该区域内所有无线AP来综合标记该位置区域的功能,如娱乐、教育、购物等等。
本发明优选实施例的位置标记方法基于无线AP的数据集,结合无线AP的地理邻域特征和用户行为特征来预测未知类型的无线AP的类型,并通过位置所在区域内的所有无线AP的类型来对该位置进行标记,描述精确细致,保证了位置标记的准确性。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。

Claims (4)

1.一种位置标记方法,其特征在于,包括以下步骤:
S1:获取待标记位置包含的所有无线AP,所有无线AP包括未知类型的无线AP和已知类型的无线AP,其中,所述待标记位置为一位置区域,未知类型和已知类型分别为功能类型;
S2:分别提取各个无线AP的地理邻域特征,每个无线AP的地理邻域特征是指在该无线AP所在的预设区域内的所有已知类型的无线AP的类型;
S3:分别提取各个无线AP的用户行为特征,每个无线AP的用户行为特征是指访问过该无线AP的所有用户访问过的所有已知类型的无线AP的类型;
S4:将各个无线AP的地理邻域特征和各个无线AP的用户行为特征分别赋予预设的权重作为输入特征,基于机器学习方法,通过学习已知类型的无线AP的特征来预测得到未知类型的无线AP的类型;其中基于机器学习方法通过学习已知类型的无线AP的特征来预测得到未知类型的无线AP的类型具体为:采用基于决策树的AdaBoost算法对由所有已知类型的无线AP组成的子数据集进行训练,然后在用于测试的由所有未知类型的无线AP组成的子数据集中进行预测,输出最后的无线AP类型;其中在针对无线AP的类型预测时选取概率最大的对应的类型作为该无线AP的最终预测的类型;
S5:根据所有无线AP的类型来将所述待标记位置内的每个无线AP类型显示出来以对所述待标记位置进行标记,以综合标记所述待标记位置的功能。
2.根据权利要求1所述的位置标记方法,其特征在于,其中无线AP所在的预设区域是指以所述无线AP为中心,100~200米为半径的区域内。
3.根据权利要求1所述的位置标记方法,其特征在于,步骤S3具体包括:首先对所有用户在不同时间段内访问过的已知类型的无线AP的类型进行统计,得到每个用户的行为特征;然后提取访问过某一无线AP的所有用户,将访问该无线AP的所有用户的行为特征作为该无线AP的用户行为特征。
4.根据权利要求3所述的位置标记方法,其特征在于,其中的不同时间段是以每两小时为一段,将时间划分为不同时间段。
CN201710257267.2A 2017-04-19 2017-04-19 一种位置标记方法 Expired - Fee Related CN107133689B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710257267.2A CN107133689B (zh) 2017-04-19 2017-04-19 一种位置标记方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710257267.2A CN107133689B (zh) 2017-04-19 2017-04-19 一种位置标记方法

Publications (2)

Publication Number Publication Date
CN107133689A CN107133689A (zh) 2017-09-05
CN107133689B true CN107133689B (zh) 2021-05-25

Family

ID=59716276

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710257267.2A Expired - Fee Related CN107133689B (zh) 2017-04-19 2017-04-19 一种位置标记方法

Country Status (1)

Country Link
CN (1) CN107133689B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108112026B (zh) * 2017-12-13 2021-10-22 北京奇虎科技有限公司 WiFi识别方法及装置
CN108769905A (zh) * 2018-05-31 2018-11-06 上海连尚网络科技有限公司 用于确定无线接入点的类别的方法及装置
CN108777878B (zh) * 2018-05-31 2021-01-05 上海连尚网络科技有限公司 用于确定无线接入点的类别的方法及装置
CN111343564A (zh) * 2018-11-30 2020-06-26 北京嘀嘀无限科技发展有限公司 无线网络的类别确定方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090253442A1 (en) * 2008-04-02 2009-10-08 Doapp, Inc. Method and system for selecting time-and location-relevant advertisements
CN104516896B (zh) * 2013-09-29 2018-03-09 国际商业机器公司 用于处理地图热点区域的方法和系统
CN104023392B (zh) * 2014-06-11 2017-07-14 百度在线网络技术(北京)有限公司 确定无线接入点的位置的方法和设备
CN106488493B (zh) * 2015-08-24 2020-06-02 阿里巴巴集团控股有限公司 识别用户的网络热点类型的方法和装置及电子设备
CN105893537B (zh) * 2016-03-31 2019-06-07 百度在线网络技术(北京)有限公司 地理信息点的确定方法和装置

Also Published As

Publication number Publication date
CN107133689A (zh) 2017-09-05

Similar Documents

Publication Publication Date Title
CN107133689B (zh) 一种位置标记方法
CN105354196B (zh) 信息推送方法和信息推送装置
CN102907151B (zh) 混合移动电话地理定位
JP5452568B2 (ja) ユーザ行動認識装置および方法
KR101510458B1 (ko) 위치정보 표현방법, 위치정보 처리방법, 위치정보모델 생성방법, 및 위치정보처리장치
US20180306594A1 (en) Method and apparatus for acquiring route popularity in road networks
CN111212383B (zh) 区域常住人口数量的确定方法、装置、服务器和介质
CN107194525A (zh) 一种基于手机信令的城市中心评估方法
CN111723959B (zh) 区域的划分方法、装置、存储介质及电子装置
CN108427679B (zh) 一种人流分布处理方法及其设备
CN109688532A (zh) 一种划分城市功能区域的方法及装置
CN106951828B (zh) 一种基于卫星影像和网络的城市区域功能属性的识别方法
CN110019617B (zh) 地址标识的确定方法和装置、存储介质、电子装置
Bergman et al. Conflation of OpenStreetMap and mobile sports tracking data for automatic bicycle routing
CN109275090A (zh) 信息处理方法、装置、终端及存储介质
JP5886718B2 (ja) 情報処理方法及び装置
Jariyasunant et al. Overcoming battery life problems of smartphones when creating automated travel diaries
Ghorpade et al. An integrated stop-mode detection algorithm for real world smartphone-based travel survey
Malmi et al. Checking in or checked in: comparing large-scale manual and automatic location disclosure patterns
CN106446102B (zh) 基于地图围栏的终端定位方法和装置
CN110781256A (zh) 基于发送位置数据确定与Wi-Fi相匹配的POI的方法及装置
CN111159583A (zh) 用户行为分析方法、装置、设备及存储介质
CN112748453B (zh) 道路侧定位方法、装置、设备及存储介质
Alhazzani et al. Urban Attractors: Discovering patterns in regions of attraction in cities
WO2017000817A1 (zh) 获取数据之间的匹配关系的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210525