CN110545558B - 基于Wi-Fi数据的高速服务区人群密度估计系统 - Google Patents

基于Wi-Fi数据的高速服务区人群密度估计系统 Download PDF

Info

Publication number
CN110545558B
CN110545558B CN201910844144.8A CN201910844144A CN110545558B CN 110545558 B CN110545558 B CN 110545558B CN 201910844144 A CN201910844144 A CN 201910844144A CN 110545558 B CN110545558 B CN 110545558B
Authority
CN
China
Prior art keywords
service area
people
data
area
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910844144.8A
Other languages
English (en)
Other versions
CN110545558A (zh
Inventor
李勇
常健新
刘伟
吴伟令
徐润
金德鹏
苏厉
王奕彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Shandong Provincial Communications Planning and Design Institute Group Co Ltd
Original Assignee
Tsinghua University
Shandong Provincial Communications Planning and Design Institute Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, Shandong Provincial Communications Planning and Design Institute Group Co Ltd filed Critical Tsinghua University
Priority to CN201910844144.8A priority Critical patent/CN110545558B/zh
Publication of CN110545558A publication Critical patent/CN110545558A/zh
Application granted granted Critical
Publication of CN110545558B publication Critical patent/CN110545558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种基于Wi‑Fi数据的高速服务区人群密度估计系统,包括数据采集装置,其被配置为采集各个服务区的地理位置相关信息及Wi‑Fi数据;利用回归模型估计出服务区人数;回归模型的自变量为各个服务区各个小时区间内连接Wi‑Fi人数,因变量为对应服务区人数;自变量的斜率为连接意愿的倒数,连接意愿由各个服务区的环境特征、功能定位特征、天特征和小时特征与相应学习参数相乘构成;环境特征和功能定位特征分别从相应服务区的Wi‑Fi数据和地理位置相关信息中提取;天特征和小时特征均为预设分段函数;根据估计出的服务区人数以及用户进入服务区的连接AP顺序,预测用户的行为偏好,进而估计出服务区中各功能区的人数,最后得到服务区的人群密度。

Description

基于Wi-Fi数据的高速服务区人群密度估计系统
技术领域
本公开属于高速服务区人数估计领域,尤其涉及一种基于Wi-Fi数据的高速服务区人群密度估计系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
城市计算是一个通过不断获取、整合和分析城市中多种异构大数据来解决城市所面临的挑战(如环境恶化、交通拥堵、能耗增加、规划落后等)的过程,致力于提高人们的生活品质、保护环境和促进城市运转效率。城市计算帮助我们理解各种城市现象的本质,合理有效的感知城市动态。在城市计算场景中,实时人群密度估算具有广泛的应用,例如精准营销,交通规划,资源配置,优化布局等。银行,医院,车站,机场;餐厅,咖啡店,购物中心,超市;酒店,体育场馆,娱乐场所等,了解这些特定区域的人数,不仅能够预防高密度人群带来的危险问题,而且还能依据人群规模分布,合理规划资源来提升公共服务质量。
对于室内环境,Wi-Fi是一个合适的选择,因为它不需要额外的硬件安装。目前,使用Wi-Fi进行人数统计可以分为如下三种技术:接收信号强度(RSSI);信道状态信息(CSI);Wi-Fi探测请求和响应。启用Wi-Fi的设备,即使没有建立连接,该设备也连续地向其周围的接入点发送“探查请求”信号。Wi-Fi嗅探器(或称Wi-Fi探针),不停地接收这类信号,并转换后发送到后台服务器。
发明人发现,现有的基于Wi-Fi的人数估计方法主要利用Wi-Fi是布置在室内的优势,相对于GPS和移动网络数据,其空间粒度更精细;利用Wi-Fi设施的必要性基础性,与红外感测,压力感测,视频监测等相比,避免了硬件成本高、安装和维护较复杂的缺点。但上述现有的三种Wi-Fi相关技术要么只能对活动的人员进行估计,要么只能探查到开启Wi-Fi的设备,导致密度估计不够全面,整体准确度有待提升。
发明内容
为了解决上述问题,本公开的第一个方面提供一种基于Wi-Fi数据的高速服务区人群密度估计系统,其旨在丰富机器学习任务的特征,以减少回归误差,提高预测精度;减少拟合系数的数量,使得在少量样本下仍能够达到较好的性能,通过Wi-Fi的记录数据提取当前场景的时间信息和空间信息,将连接意愿归结为时间特征和空间特征的加权和,对人群密度进行准确的估计。
为了实现上述目的,本公开采用如下技术方案:
一种基于Wi-Fi数据的高速服务区人群密度估计系统,包括:
数据采集装置,其被配置为:采集各个服务区的地理位置相关信息及Wi-Fi数据;所述Wi-Fi数据包括各个服务区每个小时区间内的连接Wi-Fi人数、各个服务区的上传总流量、下载总流量、用户每次连接Wi-Fi的平均时间和AP数量;
数据处理器,其被配置为:
利用回归模型估计出服务区人数;回归模型的自变量为各个服务区各个小时区间内连接Wi-Fi人数,因变量为对应服务区人数;自变量的斜率为连接意愿的倒数,连接意愿由各个服务区的环境特征、功能定位特征、天特征和小时特征与相应学习参数相乘构成;环境特征和功能定位特征分别从相应服务区的Wi-Fi数据和地理位置相关信息中提取;天特征和小时特征均为预设分段函数;
根据估计出的服务区人数以及用户进入服务区的连接AP顺序,预测用户的行为偏好,进而估计出服务区中各功能区的人数,最后得到服务区的人群密度。
为了解决上述问题,本公开的第二个方面提供一种计算机可读存储介质,其旨在丰富机器学习任务的特征,以减少回归误差,提高预测精度;减少拟合系数的数量,使得在少量样本下仍能够达到较好的性能,通过Wi-Fi的记录数据提取当前场景的时间信息和空间信息,将连接意愿归结为时间特征和空间特征的加权和,对人群密度进行准确的估计。
为了实现上述目的,本公开采用如下技术方案:
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
采集各个服务区的地理位置相关信息及Wi-Fi数据;所述Wi-Fi数据包括各个服务区每个小时区间内的连接Wi-Fi人数、各个服务区的上传总流量、下载总流量、用户每次连接Wi-Fi的平均时间和AP数量;
利用回归模型估计出服务区人数;回归模型的自变量为各个服务区各个小时区间内连接Wi-Fi人数,因变量为对应服务区人数;自变量的斜率为连接意愿的倒数,连接意愿由各个服务区的环境特征、功能定位特征、天特征和小时特征与相应学习参数相乘构成;环境特征和功能定位特征分别从相应服务区的Wi-Fi数据和地理位置相关信息中提取;天特征和小时特征均为预设分段函数;
根据估计出的服务区人数以及用户进入服务区的连接AP顺序,预测用户的行为偏好,进而估计出服务区中各功能区的人数,最后得到服务区的人群密度。
为了解决上述问题,本公开的第三个方面提供一种计算机终端,其旨在丰富机器学习任务的特征,以减少回归误差,提高预测精度;减少拟合系数的数量,使得在少量样本下仍能够达到较好的性能,通过Wi-Fi的记录数据提取当前场景的时间信息和空间信息,将连接意愿归结为时间特征和空间特征的加权和,对人群密度进行准确的估计。
为了实现上述目的,本公开采用如下技术方案:
一种计算机终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
采集各个服务区的地理位置相关信息及Wi-Fi数据;所述Wi-Fi数据包括各个服务区每个小时区间内的连接Wi-Fi人数、各个服务区的上传总流量、下载总流量、用户每次连接Wi-Fi的平均时间和AP数量;
利用回归模型估计出服务区人数;回归模型的自变量为各个服务区各个小时区间内连接Wi-Fi人数,因变量为对应服务区人数;自变量的斜率为连接意愿的倒数,连接意愿由各个服务区的环境特征、功能定位特征、天特征和小时特征与相应学习参数相乘构成;环境特征和功能定位特征分别从相应服务区的Wi-Fi数据和地理位置相关信息中提取;天特征和小时特征均为预设分段函数;
根据估计出的服务区人数以及用户进入服务区的连接AP顺序,预测用户的行为偏好,进而估计出服务区中各功能区的人数,最后得到服务区的人群密度。
本公开的有益效果是:
(1)本公开从Wi-Fi连接意愿角度出发,考虑不同的空间和时间下连接人数与总人数的关系,即扩样率,其旨在丰富机器学习任务的特征,以减少回归误差,提高预测精度;减少拟合系数的数量,使得在少量样本下仍能够达到较好的性能,通过Wi-Fi的记录数据提取当前场景的时间信息和空间信息,将连接意愿归结为时间特征和空间特征的加权和,对人群密度进行准确的估计。
(2)本公开可进一步扩展到其他场景,只要能从Wi-Fi数据中提取出反应该场景下人群连接意愿的特征,考虑时空信息,建立合理的模型,即可实时估算该场景的人群密度。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1是本公开实施例的一种基于Wi-Fi数据的高速服务区人群密度估计系统结构示意图。
图2是本公开实施例的一种基于Wi-Fi数据的高速服务区人群密度估计原理图。
具体实施方式
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
术语解释:
AP,AccessPoint,访问接入点。
Wi-Fi的连接数据能够同时记录用户的时间和位置,从数据的时空分辨率与数据变化和状态的角度来说,Wi-Fi数据是具有精细时空粒度的动态数据,通过挖掘Wi-Fi连接数据,采用合适的分析和学习方法从数据中提取有意义的信息和隐藏模式,进而估计人群密度。
如今,移动信息时代的来临使得几乎人人随身携带智能手机。因此,可根据检测到的智能手机数量去估算人数,由于Wi-Fi接入点已经广泛存在于建筑,校园乃至城市中,故Wi-Fi正是在城市计算场景下检测智能手机数量的绝佳途径。
通过识别用户手持设备的唯一MAC地址匹配访客,了解访客如何在场地中移动。分析用户在场地内的行为方式,结合物理空间的功能和用户数据的见解,量化用户的连接意愿,从而进行准确的人群密度估计。
在估计区域内的实时人数后,以此技术为基础,相应地可以解决在城市中面临的诸多挑战:
对于交通枢纽,可在一天中的不同时间优化班次模式,以节省资金和降低成本。优化指示标牌,商品摊位以及乘客与设施,零售商和餐馆的距离,来改善乘客体验。识别吞吐量,人群密度过大预警,来应对意外情况,安保和救援行动的规模也可利用空间人群估计。
对于商业建筑,通过位置分析跟踪客户的流量,停留,进入和离开时间点等,可以帮助了解最繁忙的时段并更好地管理客户需求和员工配备。根据实时的客户数量和变化趋势,可以提供更好的整体客户体验,从而提高参与度,互动性,满意度和保留率。及时调整营销措施和服务,做更好的商业规划,来增加收益。通过识别过度拥挤的热点,来改善建筑物内的空间结构。建筑物中的空调和供暖设备能够依据空间人群密度来调整。
对于医疗保障,安排合理数量的专业医护人员可以更好地与病人进行沟通,使病人能够获得及时的治疗和全面的护理,从而改善医疗环境。
对于智慧城市,了解个体流动方向,从而监控群体流量,确定最受欢迎的地点,最受欢迎的日期以及一天中最受欢迎的时段。快速实时了解城市的人群密度热点,有助于改进城市结构,通过疏导流量,如增加车次,改变公交线路等。
本公开通过分析Wi-Fi数据,探索人群的时空分布规律,挖掘用户的时空行为模式来进行实时的人群密度估计的方法。填补了根据分析Wi-Fi数据字段来估算人群密度研究的空白。实时的人群密度估计具有较强的现实意义,实现人流预警与跟踪识别,是从传统方法的被动监测到主动预测转变。基于Wi-Fi的人数估计方法最具前景,它不存在视觉盲区,不受光照影响,无需用户携带任何特定设备,并且可以直接应用于现有Wi-Fi基础设施上,部署成本低廉,适应性强,易于大规模推广。
本公开从高速服务区角度出发,高速服务区作为城际交通系统的综合交通枢纽,是人们城际出行的重要节点,实时掌握枢纽客流聚集规模和长时间驻留旅客人数变化情况对于规避重大节假日拥挤风险和实现对枢纽运力的精准调度具有重要意义。本方法为高速服务区的客流监测提供了一个新的思路,为管理部门对客流规模的实时监测和运力调度提供了数据支撑。
实施例1
本实施例的Wi-Fi数据:
无线网络的覆盖范围越来越广泛,Wi-Fi最主要的优势在于不需要布线,可以不受布线条件的限制,WIFI是由AP(Access Point)和无线网卡组成的无线网络。AP一般称为网络桥接器或接入点,它是当作传统的有线局域网络与无线局域网络之间的桥梁,Wi-Fi数据的字段除了连接时间,还会记录所连接的AP。服务区中一般在多个位置安装多个Wi-Fi接入点(AP)供附近用户使用,比如厕所、餐厅、超市等。通常用户在服务区的不同功能区时会连接不同的AP,从而Wi-Fi数据就记录用户在服务区内的行为轨迹。一般来说,服务区的Wi-Fi数据拥有以下字段:用户ID,服务区IP,连接AP,上线/下线时间,上传/下载流量,APP名称等。
本实施例的基准数据:服务区较短时间范围内的真实人数统计数据,时间可取一个月。
Wi-Fi数据用于提取特征和连接人数以构建回归模型,基准数据的真实人数作为回归目标值,从而采用机器学习回归任务的方法得到实时的真实人数估计。
本实施例作出如下假设:
1)空间假设
1.1)环境影响:当服务区的环境设施较差时,商店货物的品类和数量较少时,用户偏向于连接Wi-Fi。
1.2)功能定位:当服务区的功能定位不同时,其中用户的Wi-Fi连接意愿受到影响,偏向于旅游时,用户连接意愿较高;偏向于运输时,用户连接意愿较低。
2)时间假设
对Wi-Fi连接人数与真实人数的时间序列进行对比分析,有如下发现:
2.1)节假日与工作日的Wi-Fi连接意愿不同,游客在节假日时偏向于游玩的出行目的使得Wi-Fi连接意愿更强,而对于春节这一类的长假,在假日结束的返程期间,疲惫的身体和密集的人流量会降低用户的连接意愿。
2.2)一天内不同时刻的Wi-Fi连接意愿不同,如用户在用餐后倾向于打开手机连接Wi-Fi,此外Wi-Fi数据的高峰滞后于基准数据的高峰,考虑原因可能是用户刚进入服务区是需要处理各种事情,高峰时段较大的人车流量也是影响Wi-Fi连接意愿的因素之一。
Wi-Fi数据的特征包括:
a)捕获空间信息
a1)环境影响:
如今,随着高速客流量的快速增长,越来越多的高速服务区经过改造提高以期望提高服务质量,优化乘客的城际出行体验。随着引入大型连锁商业(商超)设施等措施的实施,部分服务区的硬件设施和服务水平得到了显著提升,场区园林化,商超高档化,餐饮特色化,厕所星级化,管理规范化,服务标准化。
环境影响除了Wi-Fi数据能够提取的特征,包括:AP数量,上传下载量,连接时间等;还可以是一些其他外部数据,比如服务区分类,场区绿化覆盖率,商超占地面积/营业额,餐饮占地面积/营业额等,这些都是服务区现有数据,不需要专门去统计,均可方便地传入环境影响特征。唯一需要注意的是,服务区类别,规模,盈利等离散变量应采用one-hot编码。
a2)功能定位:
服务区的地理位置,靠近景区和自然、人文景观的服务区定位更偏向于旅游,游客的Wi-Fi连接意愿更高。
非司机旅客越多,用户Wi-Fi连接意愿越强,服务区定位越偏向运输,用户Wi-Fi连接意愿越低。跑长途运货的司机更偏向于不连接Wi-Fi,因为需要休息和如厕。
b)捕获时间信息
b1)时间序列分解
不同服务区内人数随时间变化规律不同,简单来说,高峰日期和高峰时段不同,分析服务区内用户数量内随时间变化情况,可视化Wi-Fi连接人数和真实人数数据,可以得到两个周期性的时间序列,数值有规律的以天为周期上下波动,将时间序列进行分解,分别获得趋势性、周期性和随机性。Observed:原始数据;Trend:分解出来的趋势部分;Seasonal:周期部分;Residual:残差部分。
时间序列分解是将时间序列转换为多个不同时间序列的数学过程。原始时间序列通常分为三个组件序列:
1.周期性:以固定时间段重复的模式,呈现循环的特性。这样会产生周期性为24h的数据,选取周期性中的最大非周期性部分,即服务区在一天内24h的访问规律进行分析,服务区的周期性部分的分布规律大体相同,仅高峰时段略有偏移。以某个服务区为例,在0点~6点为低谷时段,12点和18点为两个高峰,中间15点有一个小高峰,14点和16点为小低谷,即该服务区在每天中午和傍晚用户访问较大,在早上和凌晨较为稀少。
2.趋势性:指标的基本趋势,比如线性趋势,先增加后降低的整体趋势。比较不同服务区的趋势部分,与周期形态不同,不同的服务区的趋势形态差距是很大的,因为服务区的地理位置,规模类别,功能定位都不同,这些都是影响人流量变化的主要因素。
3.随机性:也称为“噪音”,“不规则”或“余数”,这是周期和趋势序列删除后原始时间序列的残差。残差值实际上取消了数据的趋势和季节性,使得这些值与时间无关。
b1)量化时间权重
我们通过分别将Wi-Fi连接人数和基准人数的时间序列分解,获得周期性和趋势性的人数变化规律。
捕获连接人数与真实人数在分解后的序列上的差距,从而量化用户在不同时间下的Wi-Fi连接意愿。
具体来说,在经过上述分解步骤后获得Wi-Fi连接人数周期性序列Swp和趋势性序列Swt,基准人数周期性序列Sgp,趋势性序列Sgt
提取周期性序列的最大非周期部分,应当注意,本文所述的周期性序列均为此部分,此即为一天内该服务区的人流量每小时的变化规律,对于趋势性序列,若初始采用数据的时间跨度为一个月,则其为服务区人流量在一个月内每天的变化规律。
分别对周期性和趋势性进行单变量回归获得拟合曲线,即,自变量x1为Wi-Fi连接人数周期性序列,因变量y1为基准人数周期性序列时,可得到关于周期(即小时特征)的拟合序列Srp;自变量x2为Wi-Fi连接人数趋势性序列,因变量y2为基准人数趋势性序列时,可得到关于趋势(即天特征)的拟合序列Srt
通过单变量回归,获得扩样后的连接人数,提取其与真实人数之间具有最大误差的时间区间:
对于周期部分(即小时特征):如高峰时段tg,餐后时段tl等,不同服务区的最大误差时段不同。
对于趋势部分(即天特征):如长假返程日ts,节假日th,周末tw等,不同服务区的最大误差日期不同。
对于这些时段和日期,计算扩样后的人数与真实人数在该时间区间的平均比值作为权重,分别获得wg、wl、ws、wh、ww,权重大于1说明用户在此时段/日期具有较高的连接意愿,权重小于1说明用户在此时段/日期具有较低的连接意愿,其它时段/日期权重为1。
如图1和图2所示,本实施例的基于Wi-Fi数据的高速服务区人群密度估计系统,包括:
数据采集装置,其被配置为:采集各个服务区的地理位置相关信息及Wi-Fi数据;所述Wi-Fi数据包括各个服务区每个小时区间内的连接Wi-Fi人数、各个服务区的上传总流量、下载总流量、用户每次连接Wi-Fi的平均时间和AP数量。
数据处理器,其被配置为:
利用回归模型估计出服务区人数:
Figure GDA0003780155910000121
E(i,j)=1/W(i,j)
Figure GDA0003780155910000122
其中,V(i,j)为估计人数,C(i,j)为连接Wi-Fi人数,b为偏置项,E(i,j)为扩样率,W(i,j)为连接意愿,α1~α4为学习参数;
Figure GDA0003780155910000123
为天特征,/>
Figure GDA0003780155910000124
为小时特征,j为小时区间;/>
Figure GDA0003780155910000125
为环境特征,
Figure GDA0003780155910000126
为功能定位特征,i指代不同的服务区。
环境特征
Figure GDA0003780155910000127
Figure GDA0003780155910000131
Ni为第i个服务区的AP数量,Ui为第i个服务区的上传总流量,Di为第i个服务区的下载总流量,Ti为第i个服务区的用户每次连接Wi-Fi的平均时间。除了AP数量,上传下载量,连接时间等;还可以是一些其他外部数据,比如服务区分类,场区绿化覆盖率,商超占地面积/营业额,餐饮占地面积/营业额。这些都是服务区现有数据,不需要专门去统计,均可方便地传入环境影响特征。唯一需要注意的是,服务区类别,规模,盈利等离散变量应采用one-hot编码。
功能特征
Figure GDA0003780155910000132
Figure GDA0003780155910000133
Mi为往返频度大于预设阈值的往返于服务区之间的司机用户数量;由服务区与重要城市/重要文化风景区的经纬度算出实际距离(公里):各服务区到各地级市中心的平均距离
Figure GDA0003780155910000134
各服务区各5A级风景区的平均距离/>
Figure GDA0003780155910000135
其中,用户Wi-Fi连接意愿越强,连接率越高,连接人数与真实人数差距越小,进而影响回归拟合因子。有更高的连接意愿将会传递更小扩样概率,故取倒数。不同空间不同时间对应着不同的扩样概率。
在具体实施中,对第i个服务区的用户每次连接Wi-Fi的平均时间进行归一化操作。
这样能够消除量纲和属性数量级的影响,提高算法精度和加速算法(如梯度下降)的收敛速度。
归一化方法常采用min-max标准化或z-score标准化,上述公式为min-max标准化,因各属性的min值为0。
在具体实施中,司机用户数量的计算方法为:
对于一个用户ID如果在一段时间(比如:一个月),去过的服务区超过预先设定的阈值,即Wi-Fi记录中同一用户ID对应的公网IP超过预先设定的阈值,将此用户标记为司机,进而统计出司机用户数量。
其中,司机用户越多,服务区定位越偏向运输,连接意愿越低,取倒数,即此特征的数值越大,连接意愿越强。
具体地,天特征
Figure GDA0003780155910000141
为:
Figure GDA0003780155910000142
其中ts,th,tw,t1分别为长假返程日、节假日、周末和工作日对应的日期;tday为当天对应的日期。
小时特征
Figure GDA0003780155910000143
为:
Figure GDA0003780155910000144
其中tg,tl,t2分别为高峰时段、餐后时段和其他时段;thour为当前时间点对应的时间区间;wg和wl均为常数。
需要说明的是,在可用数据量足够大的时候,也可将连接人数与时空特征联合建模,即共同作为特征传入更复杂的非线性黑箱算法,比如神经网络(深度学习)和Xgboost(集成学习)等,但采用复杂黑箱算法在准确率提高的同时,解释性相应降低。
本实施例提出通过将时空信息抽象为连接意愿和扩样率,再作用到连接人数上的模型,其优势在于减少了减小拟合系数的数量的同时具有较高的解释性,使得在可用数据不够充分的条件下,仍然能够达到较好的性能。
应当注意,本实施例所示线性回归仅是回归模型的最简单实例,其它所有复杂的回归模型均可用在此方法,本实施例不限于保护最简单的线性回归。
传统方法在模型拟合时只是通过连接人数去估计真实人数,并未考虑时间信息和空间信息,但在真实世界中,在同一应用场景下,即使连接人数相同,在不同时刻和不同空间会对应着不同的真实人数,其时空特性影响着模型的拟合因子,传统方法通过求和或平均消除时空复杂性。
根据Wi-Fi数据估计真实人数,传统方法是简单地根据Wi-Fi连接人数这一单一变量进行回归。但,采用简单的连接率进行人数扩样具有极大的缺陷,连接人数与真实人数的数据分布往往表现为异方差,即X和Y虽为线性关系,但Y的方差随着X增加而增加。对于这类数据的单变量回归问题,往往预测范围而非估计点。
回归问题中最常用的最小二乘损失函数,在进行区间预测,基于的假设是残差
Figure GDA0003780155910000151
是独立变量,且方差保持不变。一旦违背了这条假设,那么线性回归模型就不成立。但也不能因此就认为使用非线性函数或基于树的模型更好,而放弃将线性回归模型作为基线方法。此时,可采用分位数损失和分位数回归,即便对于具有变化方差或非正态分布的残差,也能给出合理的预测区间。
但无论如何,预测区间的精度较低,在需要将预测值馈送到下游任务时,预测区间结果便充满了不确定性,上分位点与下分位点的扩样率能达到十倍以上的差距,这对某些场景下的影响是致命的,故无法满足真实世界中需要精准估算场景下的需求,所以本专利考虑除了连接人数外的其他特征,以便进行更精确的人群密度估算和预测,但这样得到的结果无法满足更高的精度要求。
根据估计出的服务区人数以及用户进入服务区的连接AP顺序,预测用户的行为偏好,进而估计出服务区中各功能区的人数,最后得到服务区的人群密度;
Figure GDA0003780155910000161
Figure GDA0003780155910000162
其中,
Figure GDA0003780155910000163
为各个功能区的人群密度,map操作为将轨迹序列l的人数映射到节点o上的人数,o为服务区的各功能区,每个轨迹序列l至少包含一个节点o,走过轨迹l的人数即在该l中所包含o的节点停留过的人数;rl (i,j)为行为偏好,/>
Figure GDA0003780155910000164
为轨迹序列l对应的平均人数,轨迹序列为用户进入服务区的连接AP顺序。
行为模式是人们有动机、有目标、有特点的日常活动结构、内容以及规律的行为系列。从时间的角度观察,一定的行为模式是活动时间分配的程序化结构;从空间的角度观察,是活动的地点、范围的分布。人的行为模式具体归属哪一类型是受外界环境条件和人本身所扮演的角色所制约的。
在服务区场景下,用户的行为模式与其Wi-Fi连接意愿是相关的,本实施例的目标就是从连接人群中分离出能代表低连接意愿人群行为模式的用户,对用户根据不同的行为偏好进行聚类,从而通过全面考虑不同类型用户的行动特点和行为逻辑,来推断全部人群的行为偏好。
1.去过的功能区数量多+到各功能区的次数一致性低+总连接时间长+各功能区连接时间一致性低,此类用户大概率为服务区的工作人员。服务区工作人员和普通乘客的行为偏好是不同的,前者趋向于在各功能区均匀分布,并在该服务区内的某一特定功能区长时间停留(5h以上)。
2.强连接意愿的人群,倾向于在某个地方滞留,通过Wi-Fi数据统计Wi-Fi连接用户的平均停留时间,结果表明用户的平均连接时间在1h~3h左右。若用户在单个功能区停留时间在此区间,认为其为强连接意愿用户。
3.单位时间上网流量高的用户属于强连接意愿的用户,而上网流量低的用户更倾向于在服务区内进行正常用户行为,用户上网的活跃度反映了这类用户具有较高的连接意愿。
行为偏好同样考虑时间因素和空间因素,不同服务区的功能区设施布局导致用户的行为偏好不同,至于时间因素,用户的行为偏好更多的受一天中的不同时段影响。
通过一个服务区的Wi-Fi样本,学习该服务区下用户最普遍的几种行为模式,然后根据这几种行为模式的用户占比,将服务区层面模型得到的真实人数分配到这些模式下,即可得不同功能区不同时段处在各种行为模式下的真实用户数,进而可得各功能区实时的真实人数。
应该注意到,用户的行为模式是有序的,比起直接统计各功能区的连接人数,再同服务区的总连接人数计算出现概率,区别在于,有些用户在某些功能区不止出现一次,比如厕所。而只统计功能区人次无法区分两次连接记录的间断是因为掉线:无线路由器发射功率太小,或者设备距离路由器距离太远、中间有屏蔽物阻挡;还是个体行为:离开功能区。故一定要看两次连接时间记录之间,用户是否出现在其它功能区。所以有序路径是必要的。
本实施例从Wi-Fi连接意愿角度出发,考虑不同的空间和时间下连接人数与总人数的关系,即扩样率,其旨在丰富机器学习任务的特征,以减少回归误差,提高预测精度;减少拟合系数的数量,使得在少量样本下仍能够达到较好的性能,通过Wi-Fi的记录数据提取当前场景的时间信息和空间信息,将连接意愿归结为时间特征和空间特征的加权和,通过机器学习的方法,对人群密度进行准确的估计。
本实施例可进一步扩展到其他场景,只要能从Wi-Fi数据中提取出反应该场景下人群连接意愿的特征,考虑时空信息,建立合理的模型,即可实时估算该场景的人群密度。
实施例2
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
采集各个服务区的地理位置相关信息及Wi-Fi数据;所述Wi-Fi数据包括各个服务区每个小时区间内的连接Wi-Fi人数、各个服务区的上传总流量、下载总流量、用户每次连接Wi-Fi的平均时间和AP数量;
利用回归模型估计出服务区人数;回归模型的自变量为各个服务区各个小时区间内连接Wi-Fi人数,因变量为对应服务区人数;自变量的斜率为连接意愿的倒数,连接意愿由各个服务区的环境特征、功能定位特征、天特征和小时特征与相应学习参数相乘构成;环境特征和功能定位特征分别从相应服务区的Wi-Fi数据和地理位置相关信息中提取;天特征和小时特征均为预设分段函数;
根据估计出的服务区人数以及用户进入服务区的连接AP顺序,预测用户的行为偏好,进而估计出服务区中各功能区的人数,最后得到服务区的人群密度。
本实施例从Wi-Fi连接意愿角度出发,考虑不同的空间和时间下连接人数与总人数的关系,即扩样率,其旨在丰富机器学习任务的特征,以减少回归误差,提高预测精度;减少拟合系数的数量,使得在少量样本下仍能够达到较好的性能,通过Wi-Fi的记录数据提取当前场景的时间信息和空间信息,将连接意愿归结为时间特征和空间特征的加权和,通过机器学习的方法,对人群密度进行准确的估计。
本实施例可进一步扩展到其他场景,只要能从Wi-Fi数据中提取出反应该场景下人群连接意愿的特征,考虑时空信息,建立合理的模型,即可实时估算该场景的人群密度。
实施例3
本实施例提供了一种计算机终端,其包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
采集各个服务区的地理位置相关信息及Wi-Fi数据;所述Wi-Fi数据包括各个服务区每个小时区间内的连接Wi-Fi人数、各个服务区的上传总流量、下载总流量、用户每次连接Wi-Fi的平均时间和AP数量;
利用回归模型估计出服务区人数;回归模型的自变量为各个服务区各个小时区间内连接Wi-Fi人数,因变量为对应服务区人数;自变量的斜率为连接意愿的倒数,连接意愿由各个服务区的环境特征、功能定位特征、天特征和小时特征与相应学习参数相乘构成;环境特征和功能定位特征分别从相应服务区的Wi-Fi数据和地理位置相关信息中提取;天特征和小时特征均为预设分段函数;
根据估计出的服务区人数以及用户进入服务区的连接AP顺序,预测用户的行为偏好,进而估计出服务区中各功能区的人数,最后得到服务区的人群密度。
本实施例从Wi-Fi连接意愿角度出发,考虑不同的空间和时间下连接人数与总人数的关系,即扩样率,其旨在丰富机器学习任务的特征,以减少回归误差,提高预测精度;减少拟合系数的数量,使得在少量样本下仍能够达到较好的性能,通过Wi-Fi的记录数据提取当前场景的时间信息和空间信息,将连接意愿归结为时间特征和空间特征的加权和,通过机器学习的方法,对人群密度进行准确的估计。
本实施例可进一步扩展到其他场景,只要能从Wi-Fi数据中提取出反应该场景下人群连接意愿的特征,考虑时空信息,建立合理的模型,即可实时估算该场景的人群密度。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (9)

1.一种基于Wi-Fi数据的高速服务区人群密度估计系统,其特征在于,包括:
数据采集装置,其被配置为:采集各个服务区的地理位置相关信息及Wi-Fi数据;所述Wi-Fi数据包括各个服务区每个小时区间内的连接Wi-Fi人数、各个服务区的上传总流量、下载总流量、用户每次连接Wi-Fi的平均时间和AP数量;
数据处理器,其被配置为:
利用回归模型估计出服务区人数;回归模型的自变量为各个服务区各个小时区间内连接Wi-Fi人数,因变量为对应服务区人数;自变量的斜率为连接意愿的倒数,连接意愿由各个服务区的环境特征、功能定位特征、天特征和小时特征与相应学习参数相乘构成;环境特征和功能定位特征分别从相应服务区的Wi-Fi数据和地理位置相关信息中提取;天特征和小时特征均为预设分段函数;
根据估计出的服务区人数以及用户进入服务区的连接AP顺序,预测用户的行为偏好,进而估计出服务区中各功能区的人数,最后得到服务区的人群密度;具体算法如下:在所述数据处理器中,估计出服务区中各功能区的人数的过程为:
Figure FDA0003953522670000011
Figure FDA0003953522670000012
其中,i指代不同的服务区,j为小时区间,V(i,j)为估计人数,
Figure FDA0003953522670000013
为各个功能区的人群密度,map操作为将轨迹序列l的人数映射到节点o上的人数,o为服务区的各功能区,每个轨迹序列l至少包含一个节点o,走过轨迹l的人数即在该l中所包含o的节点停留过的人数;rl (i,j)为行为偏好,nl (i,j)为轨迹序列l对应的平均人数,轨迹序列为用户进入服务区的连接AP顺序。
2.如权利要求1所述的基于Wi-Fi数据的高速服务区人群密度估计系统,其特征在于,在所述数据采集装置中,各个服务区的地理位置相关信息包括各个服务区到相应地级市中心的距离及到相应地级市5A级风景区的平均距离。
3.如权利要求1所述的基于Wi-Fi数据的高速服务区人群密度估计系统,其特征在于,在所述数据处理器中,利用回归模型估计出服务区人数的过程为:
Figure FDA0003953522670000021
E(i,j)=1/W(i,j)
Figure FDA0003953522670000022
其中,V(i,j)为估计人数,C(i,j)为连接Wi-Fi人数,b为偏置项,E(i,j)为扩样率,W(i,j)为连接意愿,α1~α4为学习参数;
Figure FDA0003953522670000023
为天特征,/>
Figure FDA0003953522670000024
为小时特征,j为小时区间,/>
Figure FDA0003953522670000025
为环境特征,/>
Figure FDA0003953522670000026
为功能定位特征,i指代不同的服务区。
4.如权利要求3所述的基于Wi-Fi数据的高速服务区人群密度估计系统,其特征在于,在所述数据处理器中,第i个服务区的环境特征
Figure FDA0003953522670000027
为:
Figure FDA0003953522670000028
其中,Ni为第i个服务区的AP数量,Ui为第i个服务区的上传总流量,Di为第i个服务区的下载总流量,Ti为第i个服务区的用户每次连接Wi-Fi的平均时间。
5.如权利要求3所述的基于Wi-Fi数据的高速服务区人群密度估计系统,其特征在于,在所述数据处理器中,功能定位特征
Figure FDA0003953522670000029
为:
Figure FDA0003953522670000031
其中,Mi为往返于服务区之间的司机用户数量;对于一个用户ID如果在一段时间,去过的服务区超过预先设定的阈值,即Wi-Fi记录中同一用户ID对应的公网IP超过预先设定的阈值,将此用户标记为司机,进而统计出司机用户数量;
Figure FDA0003953522670000032
为第i个服务区到相应地级市中心的距离,/>
Figure FDA0003953522670000033
为第i个服务区到相应地级市5A级风景区的平均距离。
6.如权利要求3所述的基于Wi-Fi数据的高速服务区人群密度估计系统,其特征在于,在所述数据处理器中,天特征
Figure FDA0003953522670000034
为:
Figure FDA0003953522670000035
其中ts,th,tw,t1分别为长假返程日、节假日、周末和工作日对应的日期;tday为当天对应的日期;ws、wh和ww均为常数。
7.如权利要求3所述的基于Wi-Fi数据的高速服务区人群密度估计系统,其特征在于,在所述数据处理器中,小时特征
Figure FDA0003953522670000036
为:
Figure FDA0003953522670000037
其中tg,tl,t2分别为高峰时段、餐后时段和其他时段;thour为当前时间点对应的时间区间;wg和wl均为常数。
8.一种计算机可读存储介质,其上存储有计算机程序,该程序通过权利要求1-7任一项权利要求所述数据处理器执行,其特征在于,执行时实现以下步骤:
采集各个服务区的地理位置相关信息及Wi-Fi数据;所述Wi-Fi数据包括各个服务区每个小时区间内的连接Wi-Fi人数、各个服务区的上传总流量、下载总流量、用户每次连接Wi-Fi的平均时间和AP数量;
利用回归模型估计出服务区人数;回归模型的自变量为各个服务区各个小时区间内连接Wi-Fi人数,因变量为对应服务区人数;自变量的斜率为连接意愿的倒数,连接意愿由各个服务区的环境特征、功能定位特征、天特征和小时特征与相应学习参数相乘构成;环境特征和功能定位特征分别从相应服务区的Wi-Fi数据和地理位置相关信息中提取;天特征和小时特征均为预设分段函数;
根据估计出的服务区人数以及用户进入服务区的连接AP顺序,预测用户的行为偏好,进而估计出服务区中各功能区的人数,最后得到服务区的人群密度;具体算法如下:估计出服务区中各功能区的人数的过程为:
Figure FDA0003953522670000041
Figure FDA0003953522670000042
其中,i指代不同的服务区,j为小时区间,V(i,j)为估计人数,
Figure FDA0003953522670000043
为各个功能区的人群密度,map操作为将轨迹序列l的人数映射到节点o上的人数,o为服务区的各功能区,每个轨迹序列l至少包含一个节点o,走过轨迹l的人数即在该l中所包含o的节点停留过的人数;rl (i,j)为行为偏好,nl (i,j)为轨迹序列l对应的平均人数,轨迹序列为用户进入服务区的连接AP顺序。
9.一种计算机终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该程序通过权利要求1-7任一项权利要求所述数据处理器执行,其特征在于,执行程序时实现以下步骤:
采集各个服务区的地理位置相关信息及Wi-Fi数据;所述Wi-Fi数据包括各个服务区每个小时区间内的连接Wi-Fi人数、各个服务区的上传总流量、下载总流量、用户每次连接Wi-Fi的平均时间和AP数量;
利用回归模型估计出服务区人数;回归模型的自变量为各个服务区各个小时区间内连接Wi-Fi人数,因变量为对应服务区人数;自变量的斜率为连接意愿的倒数,连接意愿由各个服务区的环境特征、功能定位特征、天特征和小时特征与相应学习参数相乘构成;环境特征和功能定位特征分别从相应服务区的Wi-Fi数据和地理位置相关信息中提取;天特征和小时特征均为预设分段函数;
根据估计出的服务区人数以及用户进入服务区的连接AP顺序,预测用户的行为偏好,进而估计出服务区中各功能区的人数,最后得到服务区的人群密度;具体算法如下:估计出服务区中各功能区的人数的过程为:
Figure FDA0003953522670000051
Figure FDA0003953522670000052
其中,i指代不同的服务区,j为小时区间,V(i,j)为估计人数,
Figure FDA0003953522670000053
为各个功能区的人群密度,map操作为将轨迹序列l的人数映射到节点o上的人数,o为服务区的各功能区,每个轨迹序列l至少包含一个节点o,走过轨迹l的人数即在该l中所包含o的节点停留过的人数;rl (i,j)为行为偏好,nl (i,j)为轨迹序列l对应的平均人数,轨迹序列为用户进入服务区的连接AP顺序。/>
CN201910844144.8A 2019-09-06 2019-09-06 基于Wi-Fi数据的高速服务区人群密度估计系统 Active CN110545558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910844144.8A CN110545558B (zh) 2019-09-06 2019-09-06 基于Wi-Fi数据的高速服务区人群密度估计系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910844144.8A CN110545558B (zh) 2019-09-06 2019-09-06 基于Wi-Fi数据的高速服务区人群密度估计系统

Publications (2)

Publication Number Publication Date
CN110545558A CN110545558A (zh) 2019-12-06
CN110545558B true CN110545558B (zh) 2023-03-28

Family

ID=68712907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910844144.8A Active CN110545558B (zh) 2019-09-06 2019-09-06 基于Wi-Fi数据的高速服务区人群密度估计系统

Country Status (1)

Country Link
CN (1) CN110545558B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110956808B (zh) * 2019-12-23 2020-11-24 北京交通大学 一种基于非全样定位数据的重型货车交通流量预测方法
CN112256814B (zh) * 2020-10-28 2023-05-30 每日互动股份有限公司 信息获取方法、电子设备和计算机可读存储介质
CN112463901B (zh) * 2020-11-18 2022-05-03 浙江工业大学 一种高密度群体轨迹数据的微观可视分析方法
CN113284360A (zh) * 2021-03-24 2021-08-20 重庆市市政设计研究院有限公司 一种基于全息感知的自适应智慧公交电子驿站
CN113096403A (zh) * 2021-04-19 2021-07-09 重庆交通大学 基于互联网+的智慧高速大数据服务平台
CN114757447B (zh) * 2022-06-08 2022-10-11 广东工业大学 一种多模型混合的客运枢纽站客流量预测方法及系统
CN114758421B (zh) * 2022-06-14 2022-09-02 南京金科院大学科技园管理有限公司 基于分布式和大数据的大学科技园智慧管理系统
CN115278532B (zh) * 2022-07-19 2024-03-15 中国联合网络通信集团有限公司 客流量计算方法、装置、设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106507406B (zh) * 2016-11-30 2020-01-07 四川九洲电器集团有限责任公司 一种无线网络的设备接入数的预测方法及设备
CN108012309A (zh) * 2017-11-28 2018-05-08 北京锐安科技有限公司 基于WiFi的人流量统计方法、装置及系统
CN109874109B (zh) * 2017-12-01 2022-07-29 上海博泰悦臻网络技术服务有限公司 车载设备及其服务信息推送方法
CN109561391B (zh) * 2019-01-23 2020-12-29 山东省交通规划设计院有限公司 基于蜂窝网和Wi-Fi数据的高速公路服务区人流量分析方法
CN110070718B (zh) * 2019-04-30 2020-09-22 山东省交通规划设计院有限公司 高速公路服务区服务质量动态评估方法、系统及设备

Also Published As

Publication number Publication date
CN110545558A (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
CN110545558B (zh) 基于Wi-Fi数据的高速服务区人群密度估计系统
Du et al. The sensable city: A survey on the deployment and management for smart city monitoring
Ni et al. A spatial econometric model for travel flow analysis and real-world applications with massive mobile phone data
Franco et al. Demand responsive transport: Generation of activity patterns from mobile phone network data to support the operation of new mobility services
Zhong et al. Inferring building functions from a probabilistic model using public transportation data
Yang et al. Theoretical, empirical, and operational models in hotel location research
Versichele et al. The use of Bluetooth for analysing spatiotemporal dynamics of human movement at mass events: A case study of the Ghent Festivities
Huang et al. A mobility network approach to identify and anticipate large crowd gatherings
Abedi et al. Tracking spatio-temporal movement of human in terms of space utilization using Media-Access-Control address data
US20140122190A1 (en) System and methods for detection and selection of a resource among available resources
Bao et al. Spatial analysis of bikeshare ridership with smart card and POI data using geographically weighted regression method
Alfeo et al. A stigmergy-based analysis of city hotspots to discover trends and anomalies in urban transportation usage
Boldrini et al. Weak signals in the mobility landscape: car sharing in ten European cities
Huang et al. Modeling and predicting the occupancy in a China hub airport terminal using Wi-Fi data
Li et al. Agent-based modelling of the spatial pattern of leisure visitation in forests: a case study in Wallonia, south Belgium
Huang et al. A model of two-destination choice in trip chains with GPS data
Alattar et al. Modelling cyclists’ route choice using Strava and OSMnx: A case study of the City of Glasgow
Demissie et al. Modeling location choice of taxi drivers for passenger pickup using GPS data
Yang et al. Detecting home and work locations from mobile phone cellular signaling data
Mao et al. Customer attractiveness evaluation and classification of urban commercial centers by crowd intelligence
CN114723480A (zh) 一种针对乡村旅游的客流量预测方法及货物调度系统
KR20200084884A (ko) 시간 및 공간에서의 유입들을 결정하기 위해 이종 데이터를 프로세싱하기 위한 디바이스 및 방법
Caceres et al. Supervised land use inference from mobility patterns
Lee et al. Statewide comparison of origin-destination matrices between california travel model and twitter
Ruiz-Pérez et al. Integrating high-frequency data in a GIS environment for pedestrian congestion monitoring

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 250031 Shandong Province Flyover District of Ji'nan city Shanxi Road No. 576.

Applicant after: Shandong transportation planning and Design Institute Co.,Ltd.

Applicant after: TSINGHUA University

Address before: 250031 Shandong Province Flyover District of Ji'nan city Shanxi Road No. 576.

Applicant before: SHANDONG PROVINCIAL COMMUNICATIONS PLANNING AND DESIGN INSTITUTE

Applicant before: TSINGHUA University

CB02 Change of applicant information
CB02 Change of applicant information

Address after: 250031 No. 576 Wushanxi Road, Tianqiao District, Jinan City, Shandong Province

Applicant after: Shandong transportation planning and Design Institute Group Co.,Ltd.

Applicant after: TSINGHUA University

Address before: 250031 No. 576 Wushanxi Road, Tianqiao District, Jinan City, Shandong Province

Applicant before: Shandong transportation planning and Design Institute Co.,Ltd.

Applicant before: TSINGHUA University

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant