CN107133689A - 一种位置标记方法 - Google Patents
一种位置标记方法 Download PDFInfo
- Publication number
- CN107133689A CN107133689A CN201710257267.2A CN201710257267A CN107133689A CN 107133689 A CN107133689 A CN 107133689A CN 201710257267 A CN201710257267 A CN 201710257267A CN 107133689 A CN107133689 A CN 107133689A
- Authority
- CN
- China
- Prior art keywords
- wireless aps
- type
- feature
- position mark
- mark method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Computation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Remote Sensing (AREA)
- Mobile Radio Communication Systems (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
Abstract
本发明公开了一种位置标记方法,包括:获取待标记位置包含的所有无线AP,所有无线AP包括未知类型的无线AP和已知类型的无线AP;分别提取各个无线AP的地理邻域特征;分别提取各个无线AP的用户行为特征;根据各个无线AP的地理邻域特征和各个无线AP的用户行为特征,预测得到未知类型的无线AP的类型;根据所有无线AP的类型来对所述待标记位置进行标记。本发明提出的位置标记方法,实现精确地对位置进行标记。
Description
技术领域
本发明涉及无线通讯领域,尤其涉及一种位置标记方法。
背景技术
随着智能设备的普及、人类生活半径的扩大,使得用户需要更详细、更准确的位置信息,一些相关的应用,比如室内导航、内容推荐等类型的应用也都需要精确的位置信息标记。
现有的位置标记不能细粒度地描述该位置的功能,主要体现在以下方面:(1)传统的位置标记主要根据用户行为进行分析,通常是基于在线社交网络用户的定位数据来分析某个位置的用户行为,从而根据用户行为特点来判断某个位置的功能。这种方式的数据量有限,因为用户并不总是会定位自己所在的位置,从而导致能提取出的用户行为不明显或者缺失;(2)传统位置标记也会根据地理环境来做出判断,但这些方法都只考虑地理位置相似性或者只考虑用户行为相似性,使得位置标记不够准确;(3)标记的地理范围通常比较大,不能精细的标记一个位置,比如一个商场中的某一层的某一个店铺。
以上背景技术内容的公开仅用于辅助理解本发明的构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
为解决上述技术问题,本发明提出一种位置标记方法,实现精确地对位置进行标记。
为了达到上述目的,本发明采用以下技术方案:
本发明公开了一种位置标记方法,包括以下步骤:
S1:获取待标记位置包含的所有无线AP,所有无线AP包括未知类型的无线AP和已知类型的无线AP;
S2:分别提取各个无线AP的地理邻域特征;
S3:分别提取各个无线AP的用户行为特征;
S4:根据各个无线AP的地理邻域特征和各个无线AP的用户行为特征,预测得到未知类型的无线AP的类型;
S5:根据所有无线AP的类型来对所述待标记位置进行标记。
优选地,步骤S2中无线AP的地理邻域特征是指在无线AP所在的预设区域内的所有已知类型的无线AP的类型。
优选地,其中无线AP所在的预设区域是指以所述无线AP为中心,100~200米为半径的区域内。
优选地,步骤S3中无线AP的用户行为特征是指访问过该无线AP的所有用户访问过的所有已知类型的无线AP的类型。
优选地,步骤S3具体包括:首先对所有用户在不同时间段内访问过的已知类型的无线AP的类型进行统计,得到每个用户的行为特征;然后提取访问过某一无线AP的所有用户,将访问该无线AP的所有用户的行为特征作为该无线AP的用户行为特征。
优选地,其中的不同时间段是以每两小时为一段,将时间划分为不同时间段。
优选地,步骤S4具体包括:将无线AP的地理邻域特征和无线AP的用户行为特征分别赋予预设的权重作为输入特征,基于机器学习方法,通过学习已知类型的无线AP的特征来预测得到未知类型的无线AP的类型。
优选地,基于所述机器学习方法具体为基于决策树的AdaBoost算法。
与现有技术相比,本发明的有益效果在于:本发明公开了一种位置标记方法,通过判断该位置区域内的无线AP的类型来详细了解该位置的功能,无线AP的数据集比较密集,从而使得从中提取出来的用户行为特征具有很强的代表性,位置标记精确细致,并且充分利用无线AP的地理邻域特征,提升准确率;其中通过地理邻域特征和用户行为特征的结合,保证了无线AP类型的预测的准确性,从而进一步确保了位置标记的准确性。
在进一步的方案中,本发明进一步采用机器学习方法对无线AP的类型进行预测,并采用基于决策树的AdaBoost算法,将该算法结合无线AP的地理邻域特征和用户行为特征,大大提升无线AP预测的准确率。
附图说明
图1是本发明优选实施例的位置标记方法的流程示意图;
图2是本发明优选实施例的位置标记方法中的机器学习方法的训练流程示意图。
具体实施方式
下面对照附图并结合优选的实施方式对本发明作进一步说明。
如图1所示,本发明优选实施例公开了一种位置标记方法,包括以下步骤:
S1:获取待标记位置包含的所有无线AP(Acess Point,接入点),所有无线AP包括未知类型的无线AP和已知类型的无线AP;
S2:分别提取各个无线AP的地理邻域特征;
具体地,无线AP的地理邻域特征是指在无线AP所在的预设区域内的所有已知类型的无线AP的类型,其中无线AP所在的预设区域是指以所述无线AP为中心,100~200米为半径的区域内,即处于无线AP的信号覆盖范围内。
S3:分别提取各个无线AP的用户行为特征;
其中无线AP的用户行为特征是指访问过该无线AP的所有用户访问过的所有已知类型的无线AP的类型;具体地,首先对所有用户在不同时间段内访问过的已知类型的无线AP的类型进行统计,得到每个用户的行为特征,然后提取访问某一无线AP的所有用户,将访问该无线AP的所有用户的行为特征作为该无线AP的用户行为特征;其中不同时间段是以每两小时为一段,将时间划分为不同时间段,以对所有用户在每段不同时间段内访问过的已知类型的无线AP的类型进行统计。
S4:根据各个无线AP的地理邻域特征和各个无线AP的用户行为特征的相似性,预测得到未知类型的无线AP的类型;
具体地,将无线AP的地理邻域特征和无线AP的用户行为特征分别赋予预设的权重作为输入特征,基于机器学习方法,通过学习已知类型的无线AP的特征来预测得到未知类型的无线AP的类型;其中,基于机器学习方法为基于决策树的AdaBoost算法。
在本发明实施例中,需要采用已知类型的无线AP来提前对AdaBoost算法进行训练,结合图2所示,训练的具体步骤为:
a1:数据收集步骤:首先收集POI(Point ofInternet,信息点)位置数据集和Wi-Fi连接数据集,将两类数据集进行数据整合,并进行清洗数据等数据预处理操作,然后分为两个子数据集,其中一个子数据集为已知类型的无线AP,另一个子数据集为未知类型的无线AP,其中在数据集中还包括经纬度(无线AP的地理位置)、访问用户(访问过无线AP的所有用户)、访问时间(对应用户访问的时间)等信息;其中将已知类型的无线AP的子数据集用于训练,未知类型的无线AP的子数据集用于测试。
a2:特征提取步骤:分别从两个子数据集中提取特征:包括无线AP的用户访问特征和地理邻域特征,提取步骤同上述步骤S2和S3。
a3:类型预测步骤:采用基于决策树的AdaBoost算法进行训练,然后在用于测试的子数据集中进行预测,输出最后的无线AP类型。其中在针对无线AP的类型预测,可能会有多个类型的可能性,如(类型1,概率1)、(类型2,概率2)……最后选取概率最大的对应的类型作为该无线AP的最终预测的类型。
S5:根据所有无线AP的类型来对所述待标记位置进行标记,即位置标记就是将这个位置内的每个无线AP类型显示出来即可。
本发明优选实施例可以应用于未知的地理区域,通过判断该区域内的无线AP类型,用户可以详细地连接该区域的功能。根据本发明优选实施例,当用户想要了解某个区域的功能,分类系统首先获取该区域内的所有的无线AP及其相关信息;然后对每个无线AP提取其地理邻域特征,即该无线AP周围的无线AP类型分布,再提取每个无线AP的用户行为特征,即访问过该无线AP的用户在不同时间段内访问过的无线AP的类型分布;再结合无线AP的地理邻域特征和无线AP的用户行为特征,分别赋予相应的权重,利用机器学习方法,得出每个无线AP属于不同类型的概率,取最大概率对应的类型,即为相应的无线AP的类型;最后根据该区域内所有无线AP来综合标记该位置区域的功能,如娱乐、教育、购物等等。
本发明优选实施例的位置标记方法基于无线AP的数据集,结合无线AP的地理邻域特征和用户行为特征来预测未知类型的无线AP的类型,并通过位置所在区域内的所有无线AP的类型来对该位置进行标记,描述精确细致,保证了位置标记的准确性。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。
Claims (8)
1.一种位置标记方法,其特征在于,包括以下步骤:
S1:获取待标记位置包含的所有无线AP,所有无线AP包括未知类型的无线AP和已知类型的无线AP;
S2:分别提取各个无线AP的地理邻域特征;
S3:分别提取各个无线AP的用户行为特征;
S4:根据各个无线AP的地理邻域特征和各个无线AP的用户行为特征,预测得到未知类型的无线AP的类型;
S5:根据所有无线AP的类型来对所述待标记位置进行标记。
2.根据权利要求1所述的位置标记方法,其特征在于,步骤S2中无线AP的地理邻域特征是指在无线AP所在的预设区域内的所有已知类型的无线AP的类型。
3.根据权利要求2所述的位置标记方法,其特征在于,其中无线AP所在的预设区域是指以所述无线AP为中心,100~200米为半径的区域内。
4.根据权利要求1所述的位置标记方法,其特征在于,步骤S3中无线AP的用户行为特征是指访问过该无线AP的所有用户访问过的所有已知类型的无线AP的类型。
5.根据权利要求1所述的位置标记方法,其特征在于,步骤S3具体包括:首先对所有用户在不同时间段内访问过的已知类型的无线AP的类型进行统计,得到每个用户的行为特征;然后提取访问过某一无线AP的所有用户,将访问该无线AP的所有用户的行为特征作为该无线AP的用户行为特征。
6.根据权利要求5所述的位置标记方法,其特征在于,其中的不同时间段是以每两小时为一段,将时间划分为不同时间段。
7.根据权利要求1至6任一项所述的位置标记方法,其特征在于,步骤S4具体包括:将无线AP的地理邻域特征和无线AP的用户行为特征分别赋予预设的权重作为输入特征,基于机器学习方法,通过学习已知类型的无线AP的特征来预测得到未知类型的无线AP的类型。
8.根据权利要求7所述的位置标记方法,其特征在于,基于所述机器学习方法具体为基于决策树的AdaBoost算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710257267.2A CN107133689B (zh) | 2017-04-19 | 2017-04-19 | 一种位置标记方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710257267.2A CN107133689B (zh) | 2017-04-19 | 2017-04-19 | 一种位置标记方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107133689A true CN107133689A (zh) | 2017-09-05 |
CN107133689B CN107133689B (zh) | 2021-05-25 |
Family
ID=59716276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710257267.2A Expired - Fee Related CN107133689B (zh) | 2017-04-19 | 2017-04-19 | 一种位置标记方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107133689B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108112026A (zh) * | 2017-12-13 | 2018-06-01 | 北京奇虎科技有限公司 | WiFi识别方法及装置 |
CN108769905A (zh) * | 2018-05-31 | 2018-11-06 | 上海连尚网络科技有限公司 | 用于确定无线接入点的类别的方法及装置 |
CN108777878A (zh) * | 2018-05-31 | 2018-11-09 | 上海连尚网络科技有限公司 | 用于确定无线接入点的类别的方法及装置 |
CN111343564A (zh) * | 2018-11-30 | 2020-06-26 | 北京嘀嘀无限科技发展有限公司 | 无线网络的类别确定方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090253442A1 (en) * | 2008-04-02 | 2009-10-08 | Doapp, Inc. | Method and system for selecting time-and location-relevant advertisements |
CN104023392A (zh) * | 2014-06-11 | 2014-09-03 | 百度在线网络技术(北京)有限公司 | 确定无线接入点的位置的方法和设备 |
CN104516896A (zh) * | 2013-09-29 | 2015-04-15 | 国际商业机器公司 | 用于处理地图热点区域的方法和系统 |
CN105893537A (zh) * | 2016-03-31 | 2016-08-24 | 百度在线网络技术(北京)有限公司 | 地理信息点的确定方法和装置 |
CN106488493A (zh) * | 2015-08-24 | 2017-03-08 | 阿里巴巴集团控股有限公司 | 识别用户的网络热点类型的方法和装置及电子设备 |
-
2017
- 2017-04-19 CN CN201710257267.2A patent/CN107133689B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090253442A1 (en) * | 2008-04-02 | 2009-10-08 | Doapp, Inc. | Method and system for selecting time-and location-relevant advertisements |
CN104516896A (zh) * | 2013-09-29 | 2015-04-15 | 国际商业机器公司 | 用于处理地图热点区域的方法和系统 |
CN104023392A (zh) * | 2014-06-11 | 2014-09-03 | 百度在线网络技术(北京)有限公司 | 确定无线接入点的位置的方法和设备 |
CN106488493A (zh) * | 2015-08-24 | 2017-03-08 | 阿里巴巴集团控股有限公司 | 识别用户的网络热点类型的方法和装置及电子设备 |
CN105893537A (zh) * | 2016-03-31 | 2016-08-24 | 百度在线网络技术(北京)有限公司 | 地理信息点的确定方法和装置 |
Non-Patent Citations (3)
Title |
---|
HAITIAN PANG,PENG WANG,LIN GAO,MING TANG,JIANWEI HUANG,LIFENGSUN: "Crowsourced mobility prediction based on spatio-temporal contexts", 《IEEE EXPLORE》 * |
熊倩子: "无线局域网中有区分的接入点选择算法研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 * |
蔡虹: "基于Wi-Fi网络的区域定位接入系统的研究与实现", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108112026A (zh) * | 2017-12-13 | 2018-06-01 | 北京奇虎科技有限公司 | WiFi识别方法及装置 |
CN108112026B (zh) * | 2017-12-13 | 2021-10-22 | 北京奇虎科技有限公司 | WiFi识别方法及装置 |
CN108769905A (zh) * | 2018-05-31 | 2018-11-06 | 上海连尚网络科技有限公司 | 用于确定无线接入点的类别的方法及装置 |
CN108777878A (zh) * | 2018-05-31 | 2018-11-09 | 上海连尚网络科技有限公司 | 用于确定无线接入点的类别的方法及装置 |
WO2019228493A1 (zh) * | 2018-05-31 | 2019-12-05 | 上海连尚网络科技有限公司 | 用于确定无线接入点的类别的方法及装置 |
CN108777878B (zh) * | 2018-05-31 | 2021-01-05 | 上海连尚网络科技有限公司 | 用于确定无线接入点的类别的方法及装置 |
CN111343564A (zh) * | 2018-11-30 | 2020-06-26 | 北京嘀嘀无限科技发展有限公司 | 无线网络的类别确定方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107133689B (zh) | 2021-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guan et al. | Delineating urban park catchment areas using mobile phone data: A case study of Tokyo | |
Xu et al. | Understanding aggregate human mobility patterns using passive mobile phone location data: A home-based approach | |
Sapiezynski et al. | Tracking human mobility using wifi signals | |
Zhan et al. | Inferring urban land use using large-scale social media check-in data | |
Frias-Martinez et al. | Spectral clustering for sensing urban land use using Twitter activity | |
Gao et al. | Understanding urban traffic-flow characteristics: a rethinking of betweenness centrality | |
Liu et al. | Understanding intra-urban trip patterns from taxi trajectory data | |
Hawelka et al. | Geo-located Twitter as proxy for global mobility patterns | |
Soto et al. | Robust land use characterization of urban landscapes using cell phone data | |
CN107133689A (zh) | 一种位置标记方法 | |
Marakkalage et al. | Understanding the lifestyle of older population: Mobile crowdsensing approach | |
Doyle et al. | Population mobility dynamics estimated from mobile telephony data | |
US20150248436A1 (en) | Methods, Circuits, Devices, Systems and Associated Computer Executable Code for Assessing a Presence Likelihood of a Subject at One or More Venues | |
Delaney et al. | Using a geolocation social networking application to calculate the population density of sex-seeking gay men for research and prevention services | |
CN106503108A (zh) | 地理位置检索方法和装置 | |
CN107220308A (zh) | Poi的合理性的检测方法及装置、设备及可读介质 | |
Yoo et al. | Quality of hybrid location data drawn from GPS‐enabled mobile phones: Does it matter? | |
CN110781256B (zh) | 基于发送位置数据确定与Wi-Fi相匹配的POI的方法及装置 | |
Alhazzani et al. | Urban Attractors: Discovering patterns in regions of attraction in cities | |
WO2017000817A1 (zh) | 获取数据之间的匹配关系的方法和装置 | |
Wu et al. | Urban functional area recognition based on unbalanced clustering | |
Shad et al. | Cell oscillation resolution in mobility profile building | |
CN113704373A (zh) | 基于移动轨迹数据的用户识别方法、装置及存储介质 | |
Chung et al. | Investigating the effects of POI-based land use on traffic accidents in Suzhou Industrial Park, China | |
CN110895543A (zh) | 人口迁徙跟踪展示方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210525 |
|
CF01 | Termination of patent right due to non-payment of annual fee |