CN110418282A - 一种多数据源的旅游景区客流信息统计方法 - Google Patents

一种多数据源的旅游景区客流信息统计方法 Download PDF

Info

Publication number
CN110418282A
CN110418282A CN201910342952.4A CN201910342952A CN110418282A CN 110418282 A CN110418282 A CN 110418282A CN 201910342952 A CN201910342952 A CN 201910342952A CN 110418282 A CN110418282 A CN 110418282A
Authority
CN
China
Prior art keywords
data
mobile phone
acquisition
tourist
wechat
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910342952.4A
Other languages
English (en)
Inventor
王亚弟
刘威
谢帅
周子牛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Eight Hundred Million Time And Space Information Engineering Co Ltd
Original Assignee
Beijing Eight Hundred Million Time And Space Information Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Eight Hundred Million Time And Space Information Engineering Co Ltd filed Critical Beijing Eight Hundred Million Time And Space Information Engineering Co Ltd
Priority to CN201910342952.4A priority Critical patent/CN110418282A/zh
Publication of CN110418282A publication Critical patent/CN110418282A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
    • H04W8/20Transfer of user or subscriber data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/22Processing or transfer of terminal data, e.g. status or physical capabilities
    • H04W8/24Transfer of terminal data

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种多数据源的旅游景区客流信息统计方法,包括如下步骤:1、确定采用大区制加小区制的模式;2、确定采用多数据源的采集方式;3、确定多数据源的数据格式;4、进行多数据源的数据处理。本专利针对当前手机应用的普及性,综合应用移动网络、Wi‑Fi和微信技术,实时采集景区游客手机数据作为基础数据,推算景区特定区域的客流量,形成相应的客流数据和客流分布热力图,为景区安全管理提供辅助决策数据依据。通过移动侦码技术解决了景区特定区域内游客数量的相对准确性;二是通过Wi‑Fi和微信技术的互补,解决了景区特定区域内游客数量的分布性。

Description

一种多数据源的旅游景区客流信息统计方法
技术领域
本发明涉及一种旅游景区客流信息统计方法,尤其是一种多数据源,融合 度高,准确度高的多数据源的旅游景区客流信息统计方法。
背景技术
对旅游景区客流量的研究和分析,是整个旅游业都在关注的重点。但如何 获取准确客流数据,对进入景区的,特别是特定区域内的客流数据进行统计, 通过报表分析和可视化系统对客流数据进行多元化组合、分析和深层挖掘和表 现,准确反映客流量和变化趋势,为精细化管理和应急响应提供准确及时的数 据参考依据。
目前常见的旅游景区客流数量统计和热力图的表现,多是依据票务数据、 Wi-Fi和视频监测,由于Wi-Fi监测和统计受到Wi-Fi功能的限制,无法准确 地监测和统计客流数据。视频监测和统计,受到环境的影响,如房屋、树木遮 掩等,也无法准确地监测和统计的客流数量。这些方法得到的客流数据仅是概 率数据,缺乏准确性。
发明内容
为解决上述问题,本发明提供了一种多数据源,融合度高,准确度高的多 数据源的旅游景区客流信息统计方法。
实现本发明目的的一种多数据源的旅游景区客流信息统计方法,其特征在 于,包括如下步骤:(1、确定采用大区制加小区制的模式;(2、确定采用多数 据源的采集方式;(3、确定多数据源的数据格式;(4、进行多数据源的数据处 理。
其中,所述确定采用大区制加小区制的模式,其具体方法如下:
大区制:应用移动网络侦码技术的盲测方式,在移动网络侦码基站覆盖区 域内,实时采集游客手机IMIS和IMEI码,获取景区特定区域内游客手机数据; 此种方式具有采集率高、采集范围大和不涉及游客隐私的特点,但该方式无法 采集游客手机的坐标值,故无法确定游客位置,难于生成相对准确的客流热力;
小区制:鉴于侦码技术的不足,在移动网络侦码基站覆盖区域内,划分若 干小区,采用Wi-Fi和微信技术,构建小区域范围的游客手机数据采集系统, 实时采集小区域范围内的游客手机数据,以得出游客的分布性;这两种方式不 足是采集的手机数据仅限于手机Wi-Fi和微信“附近的人”功能开启的手机。 针对该不足,采用Wi-Fi和微信互补方式和概率补偿方式,结合大区域游客数 量,推算小区域内游客数量和位置;这两种方式具有成本低,布属便捷,特别 是微信手机数据采集,无需在景区实地安装设备,只需在系统设置采集机器人 即可。
其中,所述确定采用多数据源的采集方式,具体采集方法如下:
A、基于移动网络侦码技术的手机数据信息采集
为实现对出入景区特定区域内手机动态数据信息的全面采集,基于移动网 络侦码技术,在景区特定区域设置移动侦码基站,以自适应盲侦码方式,获取 基站覆盖区域内游客手机卡IMSI和IMEI码,以此统计游客人数;移动侦码基 站的采集半径依据景区的实际,一般设置为半径500米,亦可根据实际需要设 置更大采集半径;
B、基于Wi-Fi探针技术的手机数据信息采集
基于Wi-Fi探测技术,在移动侦码基站覆盖区域内布署若干数量的Wi-Fi 探针,自动识别探针覆盖区域内已开启Wi-Fi功能的手机,实时获取该手机MAC 地址和RSSI值,以此统计覆盖区域内游客数量和每个MAC地址与Wi-Fi探针 的距离;Wi-Fi探针的采集范围一般设置为半径30-50米,可根据实际需要减 小或加大采集半径设定;
C、基于微信技术的手机数据信息采集
基于微信技术的手机数据采集,其原理与Wi-Fi技术基本相同,利用微信 中‘附近的人’功能,通过采集机器人获取附近开通微信‘附近的人’功能的 微信使用数量,来统计机器人周围人流数量,微信数据采集距离依据实际情况 可随意设定,一般设置为半径30-50米;
在一个特定区域内,同时采用Wi-Fi和微信技术,主要是考虑二者的互补, 以增强游客数量分布性的准确性。
其中,确定多数据源的数据格式,其具体方法如下:
A、基于移动网络侦码技术采集的手机数据信息格式
基于移动网络侦码技术采集的数据信息包括手机卡码、采集时间、入库时 间、归属地信息和采集设备地址等数据信息,不涉及游客个人隐私;
每条数据信息包括主键ID、手机IMSI和IMEI码、手机归属地、采集时间、 入库时间、采集设备编号和设备布署地址等数据信息;
B、基于Wi-Fi技术采集的手机数据信息格式
基于Wi-Fi技术采集的手机数据信息包括:MAC地址、RSSI值(信号强度 值)等数据,不会涉及游客的个人隐私;在设计数据表时,每条数据包括主键 ID、MAC地址、信号强度、采集时间、采集信息设备的MAC地址;
C、基于微信技术采集的手机信息数据格式
应用微信‘附近的人’功能采集的手机数据信息包括微信的昵称、地区等 信息,在设计信息保存时,每条数据包括主键ID、昵称、地区、采集机器人 IP、采集时间等;
其中,进行多数据源的数据处理,其具体方法如下:
A、基于移动网络技术的手机数据信息处理
对于基于移动网络技术的手机信息采集的数据,覆盖范围大,采集的数据 主要是手机IMSI和IMEI号,没有具体的经纬度值;由于本方法在景区特定区 域仅布属一台采集基站,因此,即可得到基站覆盖区域的手机数,该手机数约 等于该区域的游客数量;通过手机IMSI和IMEI号,得出特定区域的游客数据, 通过查询手机归属地数据库,得出手机归属地;
数据的获取步骤
(1)从数据库中获取当前采集设备编号的唯一标识;
(2)通过设备编号查找当前接收到的手机IMSI和IMEI数据;
(3)查询数据库是否为已获取数据,若是则存入采集数库,若不是则存入 游客数量数据库;
(4)手机IMSI和IMEI码与采集设备互为映射;
(5)手机IMSI和IMEI码映射手机归属地;
(6)统计获取到的IMSI和IMEI数量,记为游客数T,分类手机归属地;
B、基于Wi-Fi技术的手机数据信息处理
基于WiFi探针技术的手机数据信息采集,在同一区域设置若干个探针,为 防止出现盲区,布属的探针覆盖范围存在交叉重叠,各探针在同一时间获取的 手机MAC地址在重叠区域存在重复采集,即同一MAC地址被多个探针采集,因 此需要进行去重处理;在对同一区域探针采集的MAC地址进行总体统计时,每 一个MAC值仅由一个探针进行一次计数;
(1)数据的求取步骤
从数据库中获取当前区域内探针的数量和每个探针的唯一标识值ID,该区 域所有探针数组为:Y=[Y1,Y2,.........Ym];Yi={Y1,Y2,……Yn}
每个探针所采集的MAC地址的数组为:MYi={My1,My2,……Myn}
由此,生成该区域所有Wi-Fi探针采集的MAC地址矩阵为:
求解数组Myi,,得出相同的Myi,生成新的数组Ymi,即:
(2)MAC数据去重处理
求解该数组Ymi中同一MAC值所映射的全部Wi-Fi探针,遍历全部映射 探针,选取最短距离归属于相应的Wi-Fi探针,删除其他Wi-Fi探针采集的MAC 数据,生成该探针的全部MAC数量,即为该探针采集的游客数量Ui,以此类推, 直至全部探针遍历完毕,累积该特定区域全部探针采集的MAC地址数量,即为 该特定区域探针游客数量U;
(3)数据补偿处理
由于Wi-Fi和微信采集游客手机数据,是基于游客开启Wi-Fi和微信‘附 近的人’功能,如果该两功能未开启,则采集不到游客的手机数据信息;因此, 在实际应用中,结合移动网络侦码基站采集的游客手机数据量,通过数据积累, 生成数据补偿系数,以此修正和提高Wi-Fi采集数据的准确率,即为:
γ概率补偿系数
C、基于微信技术的手机数据信息处理
基于微信技术的手机数据信息处理同样存在数据重复采集和概率补偿的 问题,其数据处理与基于Wi-Fi技术的手机数据信息处理原理相同;
D、多源数据综合处理
基于移动网络技术手机信息采集覆盖范围相对大,准确性高,只要是所在 范围内的手机基本都能被检测到;由于数据采集应用的是被动盲采集技术,所 以不获取被采集者的坐标位置;
Wi-Fi探针能获取覆盖范围的打开Wi-Fi功能的手机信号,成本相对比较 低,对于小范围30-50米,能很好的获取覆盖范围内手机信号;但是如果手机 没有打开Wi-Fi功能,则不能被检测到;
微信技术采集数据的方法,使用微信程序中‘附近的人’功能进行数据采 集,采集方法简便,成本低,但如果微信程序应用者没有打开‘附近的人’功 能,则采集不到信号;
因此,在对景区人流采集与人流分布时,移动网络技术获取大范围精准人 流数量,利用Wi-Fi和微信技术获取小范围人流数量,以便实现人流分布热力 图的分析;
在同一区域内布署安装三种采集设备,对区域内的手机数量进行采集,移 动网络技术设备能精准采集到大区域内的所有手机数据,Wi-Fi与微信设备能 采集到小区域内的手机数据,三者数据融合能清晰的表现区域内手机的分布, 且不涉及个人隐私。
T:移动基站采集的游客手机数量,是大区域内的游客数量;
U:Wi-Fi探针采集的游客手机数量,是小区域内的游客数量;
V:微信采集的游客手机数量,是小区域内的游客数量;
由于Wi-Fi和微信的手机数据采集是有限制的采集,因此采用Wi-Fi和微 信互为验证和先验概率补偿方式确定小区域内的游客数量,记为:UVi
U=[UV1,UV2,……UVn]
则:
因此,基于T,给出大区域内的游客数量,基于U和V,给出大区域内的 游客热力分布。
附图说明
图1为大区制加小区制多数据源的景区客流数据采集统计原理图
图2为基于移动网络技术获取手机数据流程图
图3为基于移动网络侦码技术采集的手机数据信息格式图
图4为基于Wi-Fi技术采集的手机数据信息格式图
图5为数据库表字段设计图
具体实施方式
本发明的一种多数据源的旅游景区客流信息统计方法,其特征在于,包括 如下步骤:(1、确定采用大区制加小区制的模式;(2、确定采用多数据源的采 集方式;(3、确定多数据源的数据格式;(4、进行多数据源的数据处理。
其中,所述确定采用大区制加小区制的模式,如图1所示,其具体方法如 下:
大区制:应用移动网络侦码技术的盲测方式,在移动网络侦码基站覆盖区 域内,实时采集游客手机IMIS和IMEI码,获取景区特定区域内游客手机数据; 此种方式具有采集率高、采集范围大和不涉及游客隐私的特点,但该方式无法 采集游客手机的坐标值,故无法确定游客位置,难于生成相对准确的客流热力;
小区制:鉴于侦码技术的不足,在移动网络侦码基站覆盖区域内,划分若 干小区,采用Wi-Fi和微信技术,构建小区域范围的游客手机数据采集系统, 实时采集小区域范围内的游客手机数据,以得出游客的分布性;这两种方式不 足是采集的手机数据仅限于手机Wi-Fi和微信“附近的人”功能开启的手机。 针对该不足,采用Wi-Fi和微信互补方式和概率补偿方式,结合大区域游客数 量,推算小区域内游客数量和位置;这两种方式具有成本低,布属便捷,特别 是微信手机数据采集,无需在景区实地安装设备,只需在系统设置采集机器人 即可。
其中,所述确定采用多数据源的采集方式,具体采集方法如下:
A、基于移动网络侦码技术的手机数据信息采集
为实现对出入景区特定区域内手机动态数据信息的全面采集,基于移动网 络侦码技术,在景区特定区域设置移动侦码基站,以自适应盲侦码方式,获取 基站覆盖区域内游客手机卡IMSI和IMEI码,以此统计游客人数;移动侦码基 站的采集半径依据景区的实际,一般设置为半径500米,亦可根据实际需要设 置更大采集半径;
B、基于Wi-Fi探针技术的手机数据信息采集
基于Wi-Fi探测技术,在移动侦码基站覆盖区域内布署若干数量的Wi-Fi 探针,自动识别探针覆盖区域内已开启Wi-Fi功能的手机,实时获取该手机MAC 地址和RSSI值,以此统计覆盖区域内游客数量和每个MAC地址与Wi-Fi探针 的距离;Wi-Fi探针的采集范围一般设置为半径30-50米,可根据实际需要减 小或加大采集半径设定;
C、基于微信技术的手机数据信息采集
基于微信技术的手机数据采集,其原理与Wi-Fi技术基本相同,利用微信 中‘附近的人’功能,通过采集机器人获取附近开通微信‘附近的人’功能的 微信使用数量,来统计机器人周围人流数量,微信数据采集距离依据实际情况 可随意设定,一般设置为半径30-50米;
在一个特定区域内,同时采用Wi-Fi和微信技术,主要是考虑二者的互补, 以增强游客数量分布性的准确性。
其中,确定多数据源的数据格式,其具体方法如下:
A、基于移动网络侦码技术采集的手机数据信息格式
基于移动网络侦码技术采集的数据信息包括手机卡码、采集时间、入库时 间、归属地信息和采集设备地址等数据信息,不涉及游客个人隐私;
每条数据信息包括主键ID、手机IMSI和IMEI码、手机归属地、采集时间、 入库时间、采集设备编号和设备布署地址等数据信息;数据库表字段设计如图 3所示。
B、基于Wi-Fi技术采集的手机数据信息格式
基于Wi-Fi技术采集的手机数据信息包括:MAC地址、RSSI值(信号强度 值)等数据,不会涉及游客的个人隐私;在设计数据表时,每条数据包括主键 ID、MAC地址、信号强度、采集时间、采集信息设备的MAC地址;数据库表字 段设计如图4所示。
C、基于微信技术采集的手机信息数据格式
应用微信‘附近的人’功能采集的手机数据信息包括微信的昵称、地区等 信息,在设计信息保存时,每条数据包括主键ID、昵称、地区、采集机器人 IP、采集时间等;数据库表字段设计如图5所示。
其中,进行多数据源的数据处理,其具体方法如下:
A、基于移动网络技术的手机数据信息处理
对于基于移动网络技术的手机信息采集的数据,覆盖范围大,采集的数据 主要是手机IMSI和IMEI号,没有具体的经纬度值;由于本方法在景区特定区 域仅布属一台采集基站,因此,即可得到基站覆盖区域的手机数,该手机数约 等于该区域的游客数量;通过手机IMSI和IMEI号,得出特定区域的游客数据, 通过查询手机归属地数据库,得出手机归属地;
数据的获取步骤
(1)从数据库中获取当前采集设备编号的唯一标识;
(2)通过设备编号查找当前接收到的手机IMSI和IMEI数据;
(3)查询数据库是否为已获取数据,若是则存入采集数库,若不是则存入 游客数量数据库;
(4)手机IMSI和IMEI码与采集设备互为映射;
(5)手机IMSI和IMEI码映射手机归属地;
(6)统计获取到的IMSI和IMEI数量,记为游客数T,分类手机归属地; 获取数据流程如图2所示。
B、基于Wi-Fi技术的手机数据信息处理
基于WiFi探针技术的手机数据信息采集,在同一区域设置若干个探针,为 防止出现盲区,布属的探针覆盖范围存在交叉重叠,各探针在同一时间获取的 手机MAC地址在重叠区域存在重复采集,即同一MAC地址被多个探针采集,因 此需要进行去重处理;在对同一区域探针采集的MAC地址进行总体统计时,每 一个MAC值仅由一个探针进行一次计数;
(1)数据的求取步骤
从数据库中获取当前区域内探针的数量和每个探针的唯一标识值ID,该区 域所有探针数组为:Y=[Y1,Y2,.........Ym];Yi={Y1,Y2,……Yn}
每个探针所采集的MAC地址的数组为:MYi={My1,My2,……Myn}
由此,生成该区域所有Wi-Fi探针采集的MAC地址矩阵为:
求解数组Myi,,得出相同的Myi,生成新的数组Ymi,即:
(2)MAC数据去重处理
求解该数组Ymi中同一MAC值所映射的全部Wi-Fi探针,遍历全部映射 探针,选取最短距离归属于相应的Wi-Fi探针,删除其他Wi-Fi探针采集的MAC 数据,生成该探针的全部MAC数量,即为该探针采集的游客数量Ui,以此类推, 直至全部探针遍历完毕,累积该特定区域全部探针采集的MAC地址数量,即为 该特定区域探针游客数量U;
(3)数据补偿处理
由于Wi-Fi和微信采集游客手机数据,是基于游客开启Wi-Fi和微信‘附 近的人’功能,如果该两功能未开启,则采集不到游客的手机数据信息;因此, 在实际应用中,结合移动网络侦码基站采集的游客手机数据量,通过数据积累, 生成数据补偿系数,以此修正和提高Wi-Fi采集数据的准确率,即为:
γ概率补偿系数
C、基于微信技术的手机数据信息处理
基于微信技术的手机数据信息处理同样存在数据重复采集和概率补偿的 问题,其数据处理与基于Wi-Fi技术的手机数据信息处理原理相同;
D、多源数据综合处理
基于移动网络技术手机信息采集覆盖范围相对大,准确性高,只要是所在 范围内的手机基本都能被检测到;由于数据采集应用的是被动盲采集技术,所 以不获取被采集者的坐标位置;
Wi-Fi探针能获取覆盖范围的打开Wi-Fi功能的手机信号,成本相对比较 低,对于小范围30-50米,能很好的获取覆盖范围内手机信号;但是如果手机 没有打开Wi-Fi功能,则不能被检测到;
微信技术采集数据的方法,使用微信程序中‘附近的人’功能进行数据采 集,采集方法简便,成本低,但如果微信程序应用者没有打开‘附近的人’功 能,则采集不到信号;
因此,在对景区人流采集与人流分布时,移动网络技术获取大范围精准人 流数量,利用Wi-Fi和微信技术获取小范围人流数量,以便实现人流分布热力 图的分析;
在同一区域内布署安装三种采集设备,对区域内的手机数量进行采集,移 动网络技术设备能精准采集到大区域内的所有手机数据,Wi-Fi与微信设备能 采集到小区域内的手机数据,三者数据融合能清晰的表现区域内手机的分布, 且不涉及个人隐私。
T:移动基站采集的游客手机数量,是大区域内的游客数量;
U:Wi-Fi探针采集的游客手机数量,是小区域内的游客数量;
V:微信采集的游客手机数量,是小区域内的游客数量;
由于Wi-Fi和微信的手机数据采集是有限制的采集,因此采用Wi-Fi和微 信互为验证和先验概率补偿方式确定小区域内的游客数量,记为:UVi
U=[UV1,UV2,……UVn]
则:
因此,基于T,给出大区域内的游客数量,基于U和V,给出大区域内的 游客热力分布。
上面所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发 明的范围进行限定,在不脱离本发明设计精神前提下,本领域普通工程技术人 员对本发明技术方案做出的各种变形和改进,均应落入本发明的权利要求书确 定的保护范围内。

Claims (5)

1.一种多数据源的旅游景区客流信息统计方法,其特征在于,包括如下步骤:(1、确定采用大区制加小区制的模式;(2、确定采用多数据源的采集方式;(3、确定多数据源的数据格式;(4、进行多数据源的数据处理。
2.根据权利要求1所述的一种多数据源的旅游景区客流信息统计方法,其特征在于:
其中,所述确定采用大区制加小区制的模式,其具体方法如下:
大区制:应用移动网络侦码技术的盲测方式,在移动网络侦码基站覆盖区域内,实时采集游客手机IMIS和IMEI码,获取景区特定区域内游客手机数据;
小区制:鉴于侦码技术的不足,在移动网络侦码基站覆盖区域内,划分若干小区,采用Wi-Fi和微信技术,构建小区域范围的游客手机数据采集系统,实时采集小区域范围内的游客手机数据,以得出游客的分布性;
采用Wi-Fi和微信互补方式和概率补偿方式,结合大区域游客数量,推算小区域内游客数量和位置。
3.根据权利要求1所述的一种多数据源的旅游景区客流信息统计方法,其特征在于:
其中,所述确定采用多数据源的采集方式,具体采集方法如下:
A、基于移动网络侦码技术的手机数据信息采集
为实现对出入景区特定区域内手机动态数据信息的全面采集,基于移动网络侦码技术,在景区特定区域设置移动侦码基站,以自适应盲侦码方式,获取基站覆盖区域内游客手机卡IMSI和IMEI码,以此统计游客人数;移动侦码基站的采集半径依据景区的实际,一般设置为半径500米,亦可根据实际需要设置更大采集半径;
B、基于Wi-Fi探针技术的手机数据信息采集
基于Wi-Fi探测技术,在移动侦码基站覆盖区域内布署若干数量的Wi-Fi探针,自动识别探针覆盖区域内已开启Wi-Fi功能的手机,实时获取该手机MAC地址和RSSI值,以此统计覆盖区域内游客数量和每个MAC地址与Wi-Fi探针的距离;Wi-Fi探针的采集范围一般设置为半径30-50米,可根据实际需要减小或加大采集半径设定;
C、基于微信技术的手机数据信息采集
基于微信技术的手机数据采集,利用微信中‘附近的人’功能,通过采集机器人获取附近开通微信‘附近的人’功能的微信使用数量,来统计机器人周围人流数量,微信数据采集距离依据实际情况可随意设定,一般设置为半径30-50米。
4.根据权利要求1所述的一种多数据源的旅游景区客流信息统计方法,其特征在于:
其中,确定多数据源的数据格式,其具体方法如下:
A、基于移动网络侦码技术采集的手机数据信息格式
基于移动网络侦码技术采集的数据信息包括手机卡码、采集时间、入库时间、归属地信息和采集设备地址等数据信息,不涉及游客个人隐私;
每条数据信息包括主键ID、手机IMSI和IMEI码、手机归属地、采集时间、入库时间、采集设备编号和设备布署地址等数据信息;
B、基于Wi-Fi技术采集的手机数据信息格式
基于Wi-Fi技术采集的手机数据信息包括:MAC地址、RSSI值等数据,不会涉及游客的个人隐私;在设计数据表时,每条数据包括主键ID、MAC地址、信号强度、采集时间、采集信息设备的MAC地址;
C、基于微信技术采集的手机信息数据格式
应用微信‘附近的人’功能采集的手机数据信息包括微信的昵称、地区等信息,在设计信息保存时,每条数据包括主键ID、昵称、地区、采集机器人IP、采集时间等。
5.根据权利要求1所述的一种多数据源的旅游景区客流信息统计方法,其特征在于:
其中,进行多数据源的数据处理,其具体方法如下:
A、基于移动网络技术的手机数据信息处理
对于基于移动网络技术的手机信息采集的数据,覆盖范围大,采集的数据主要是手机IMSI和IMEI号,没有具体的经纬度值;由于本方法在景区特定区域仅布属一台采集基站,因此,即可得到基站覆盖区域的手机数,该手机数约等于该区域的游客数量;通过手机IMSI和IMEI号,得出特定区域的游客数据,通过查询手机归属地数据库,得出手机归属地;
数据的获取步骤
(1)从数据库中获取当前采集设备编号的唯一标识;
(2)通过设备编号查找当前接收到的手机IMSI和IMEI数据;
(3)查询数据库是否为已获取数据,若是则存入采集数库,若不是则存入游客数量数据库;
(4)手机IMSI和IMEI码与采集设备互为映射;
(5)手机IMSI和IMEI码映射手机归属地;
(6)统计获取到的IMSI和IMEI数量,记为游客数T,分类手机归属地;
B、基于Wi-Fi技术的手机数据信息处理
基于WiFi探针技术的手机数据信息采集,在同一区域设置若干个探针,为防止出现盲区,布属的探针覆盖范围存在交叉重叠,各探针在同一时间获取的手机MAC地址在重叠区域存在重复采集,即同一MAC地址被多个探针采集,因此需要进行去重处理;在对同一区域探针采集的MAC地址进行总体统计时,每一个MAC值仅由一个探针进行一次计数;
(1)数据的求取步骤
从数据库中获取当前区域内探针的数量和每个探针的唯一标识值ID,该区域所有探针数组为:Y=[Y1,Y2,………Ym];Yi={Y1,Y2,……Yn}
每个探针所采集的MAC地址的数组为:MYi={My1,My2,……Myn}
由此,生成该区域所有Wi-Fi探针采集的MAC地址矩阵为:
求解数组Myi,,得出相同的Myi,生成新的数组Ymi,即:
(2)MAC数据去重处理
求解该数组Ymi中同一MAC值所映射的全部Wi-Fi探针,遍历全部映射探针,选取最短距离归属于相应的Wi-Fi探针,删除其他Wi-Fi探针采集的MAC数据,生成该探针的全部MAC数量,即为该探针采集的游客数量Ui,以此类推,直至全部探针遍历完毕,累积该特定区域全部探针采集的MAC地址数量,即为该特定区域探针游客数量U;
(3)数据补偿处理
由于Wi-Fi和微信采集游客手机数据,是基于游客开启Wi-Fi和微信‘附近的人’功能,如果该两功能未开启,则采集不到游客的手机数据信息;因此,在实际应用中,结合移动网络侦码基站采集的游客手机数据量,通过数据积累,生成数据补偿系数,以此修正和提高Wi-Fi采集数据的准确率,即为:
γ概率补偿系数
C、基于微信技术的手机数据信息处理
基于微信技术的手机数据信息处理同样存在数据重复采集和概率补偿的问题,其数据处理与基于Wi-Fi技术的手机数据信息处理原理相同;
D、多源数据综合处理
基于移动网络技术手机信息采集覆盖范围相对大,准确性高,只要是所在范围内的手机基本都能被检测到;由于数据采集应用的是被动盲采集技术,所以不获取被采集者的坐标位置;
Wi-Fi探针能获取覆盖范围的打开Wi-Fi功能的手机信号,成本相对比较低,对于小范围30-50米,能很好的获取覆盖范围内手机信号;但是如果手机没有打开Wi-Fi功能,则不能被检测到;
微信技术采集数据的方法,使用微信程序中‘附近的人’功能进行数据采集,采集方法简便,成本低,但如果微信程序应用者没有打开‘附近的人’功能,则采集不到信号;
因此,在对景区人流采集与人流分布时,移动网络技术获取大范围精准人流数量,利用Wi-Fi和微信技术获取小范围人流数量,以便实现人流分布热力图的分析;
在同一区域内布署安装三种采集设备,对区域内的手机数量进行采集,移动网络技术设备能精准采集到大区域内的所有手机数据,Wi-Fi与微信设备能采集到小区域内的手机数据,三者数据融合能清晰的表现区域内手机的分布,且不涉及个人隐私;
T:移动基站采集的游客手机数量,是大区域内的游客数量;
U:Wi-Fi探针采集的游客手机数量,是小区域内的游客数量;
V:微信采集的游客手机数量,是小区域内的游客数量;
由于Wi-Fi和微信的手机数据采集是有限制的采集,因此采用Wi-Fi和微信互为验证和先验概率补偿方式确定小区域内的游客数量,记为:UVi
U=[UV1,UV2,……UVn]
则:
因此,基于T,给出大区域内的游客数量,基于U和V,给出大区域内的游客热力分布。
CN201910342952.4A 2019-04-26 2019-04-26 一种多数据源的旅游景区客流信息统计方法 Pending CN110418282A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910342952.4A CN110418282A (zh) 2019-04-26 2019-04-26 一种多数据源的旅游景区客流信息统计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910342952.4A CN110418282A (zh) 2019-04-26 2019-04-26 一种多数据源的旅游景区客流信息统计方法

Publications (1)

Publication Number Publication Date
CN110418282A true CN110418282A (zh) 2019-11-05

Family

ID=68357685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910342952.4A Pending CN110418282A (zh) 2019-04-26 2019-04-26 一种多数据源的旅游景区客流信息统计方法

Country Status (1)

Country Link
CN (1) CN110418282A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257939A (zh) * 2020-10-28 2021-01-22 每日互动股份有限公司 一种地理区域热度的处理方法、计算机设备及介质
CN114494616A (zh) * 2021-12-24 2022-05-13 浙江中测新图地理信息技术有限公司 一种景区多源客流数据的实时三维仿真模拟方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257939A (zh) * 2020-10-28 2021-01-22 每日互动股份有限公司 一种地理区域热度的处理方法、计算机设备及介质
CN112257939B (zh) * 2020-10-28 2023-02-28 每日互动股份有限公司 一种地理区域热度的处理方法、计算机设备及介质
CN114494616A (zh) * 2021-12-24 2022-05-13 浙江中测新图地理信息技术有限公司 一种景区多源客流数据的实时三维仿真模拟方法

Similar Documents

Publication Publication Date Title
KR101089995B1 (ko) 핑거 프린트 방식의 위치 추적 시스템 및 그 방법
CN104914457B (zh) 用于自适应定位的方法和装置
CN109996186A (zh) 一种网络覆盖问题识别方法及装置、可读取存储介质
CN103905992B (zh) 一种基于指纹数据的无线传感器网络的室内定位方法
CN109362038A (zh) 基于WiFi探针的客流量统计分析及服务的方法和系统
CN104457751A (zh) 室内外场景识别方法及系统
CN103649770B (zh) 移动设备的位置估计
CN107767669A (zh) 基于WiFi和蓝牙识别的公交线路客流OD估计方法
CN103957505A (zh) 一种基于ap的行为轨迹检测分析与服务提供系统及方法
CN104736968A (zh) 众包室内定位
CN111698774B (zh) 基于多源信息融合的室内定位方法及装置
CN105933975A (zh) 一种基于WiFi指纹的精度改善的室内定位方法
CN108109423A (zh) 基于WiFi室内定位的地下停车场智能导航方法及系统
CN105704652A (zh) 一种wlan/蓝牙定位中的指纹库采集和优化方法
CN107977673A (zh) 一种基于大数据的经济活动人口识别方法
CN105355047B (zh) 多交通检测源动态时间粒度的数据融合处理方法
CN109656973A (zh) 一种目标对象关联分析方法及装置
CN110418282A (zh) 一种多数据源的旅游景区客流信息统计方法
CN110213710A (zh) 一种基于随机森林的高性能室内定位方法、室内定位系统
CN107121140A (zh) 一种基于多源传感器的位置获取方法
CN103476113B (zh) 基于mnl概率辨识室内定位系统及方法、定位模型建立系统
CN107314757A (zh) 一种多层建筑物的楼层定位系统及定位方法
CN108733774A (zh) 一种基于大数据的失业人口动态监测方法
CN105849578A (zh) 定位系统和程序
Yu et al. Floor positioning method indoors with smartphone’s barometer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191105

RJ01 Rejection of invention patent application after publication