CN112001829B - 一种基于手机信令数据的人口分布判断方法 - Google Patents

一种基于手机信令数据的人口分布判断方法 Download PDF

Info

Publication number
CN112001829B
CN112001829B CN202010820016.2A CN202010820016A CN112001829B CN 112001829 B CN112001829 B CN 112001829B CN 202010820016 A CN202010820016 A CN 202010820016A CN 112001829 B CN112001829 B CN 112001829B
Authority
CN
China
Prior art keywords
data
data set
time
base station
active
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010820016.2A
Other languages
English (en)
Other versions
CN112001829A (zh
Inventor
胡倩
王振
张志敏
宋军
陈天一
王天青
禚保玲
盛捷
高玉亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Urban Planning And Design Institute
Original Assignee
Qingdao Urban Planning And Design Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Urban Planning And Design Institute filed Critical Qingdao Urban Planning And Design Institute
Priority to CN202010820016.2A priority Critical patent/CN112001829B/zh
Publication of CN112001829A publication Critical patent/CN112001829A/zh
Application granted granted Critical
Publication of CN112001829B publication Critical patent/CN112001829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于手机信令数据的人口分布判断方法,首先通过手机信令数据预处理,提取手机信令数据中的有效信息,建立用户的数据集合N;其次,通过位置同化得到新的数据集合N;最后通过对新的数据集合N中的数据进行计算得到用户每天在各个基站的停留时长,结合单日活跃时长阈值与累计活跃天数阈值两项判断标准识别职住地;在位置同化处理中仅对数据进行一次遍历,并仅用一个参数即可完成数据清洗,提高了数据清洗效率,降低了过多参数对数据清洗效果的影响;在职住地判断中结合单日活跃时长阈值与累计活跃天数阈值两项判断标准,对多候选位置的情况提出了判断方案;本方法可以快速准确的基于手机信令数据识别常住人口、就业岗位的分布。

Description

一种基于手机信令数据的人口分布判断方法
技术领域
本发明属于智慧城市领域,具体地说,是涉及一种基于手机信令数据的人口分布判断方法。
背景技术
在建设现代化智慧城市进程中,了解城市居民出行规律和人口流动情况不仅能够帮助人们了解城市的现状,还能帮助城市建设和城市规划管理者对城市的公共资源进行合理的部署和使用,进而提高公共资源的利用率,促进城市更加和谐发展。因此,在建设智慧城市的过程中,了解城市居民的空间分布、职住情况、出行时空分布以及人流量变化规律是一项重要的工作。
手机信令数据是一种时空轨迹大数据,是移动通讯设备与公用移动通信基站信息交互行为留下的时空轨迹,信令数据具有覆盖广、连续性强、采样率高等特点。相较于客运班次等传统数据,手机信令数据能够体现“人”的时空行为特征,更为精准的判断常住人口,工作岗位和短期外来人口,有效弥补传统数据主要反映城市建成环境特征、社会经济发展状态等的不足。
发明内容
本发明的目的在于提供一种基于手机信令数据的人口分布判断方法,可以快速准确的基于所述手机信令数据识别常住人口、就业岗位的分布,可为城市公共服务布局提供更准确、更便捷的需求分布,为政府部门的管理决策、统计规划等工作提供强有力的数据支撑。
本发明采用如下技术方案实现:
提出一种基于手机信令数据的人口分布判断方法,通过以下步骤实现:
与现有技术相比,本发明的优点和积极效果是:提出一种基于手机信令数据的人口分布判断方法,首先通过手机信令数据预处理,提取手机信令数据中的有效信息,建立用户的数据集合N;其次,通过位置同化得到新的数据集合N;最后通过对新的数据集合N中的数据进行计算得到用户每天在各个基站的停留时长,结合单日活跃时长阈值与累计活跃天数阈值两项判断标准识别职住地;在位置同化处理中,取代原有算法数据清洗流程中需要对数据进行多次遍历且需要多个参数用以数据清洗的方式,本发明中仅对数据进行一次遍历,并仅用一个参数即可完成数据清洗,提高了数据清洗效率,降低了过多参数对数据清洗效果的影响;在职住地判断中,相较于原有聚类的判断方式,本发明结合了单日活跃时长阈值与累计活跃天数阈值两项判断标准,对多候选位置的情况提出了判断方案;该判断方法可以快速准确的基于所述手机信令数据识别常住人口、就业岗位的分布,可为城市公共服务布局提供更准确、更便捷的需求分布,为政府部门的管理决策、统计规划等工作提供强有力的数据支撑。
结合附图阅读本发明实施方式的详细描述后,本发明的其他特点和优点将变得更加清楚。
附图说明
图1为本发明提出一种基于手机信令数据的人口分布判断方法的流程图;
图2为本发明中步骤2的具体实施例流程图;
图3为本发明中步骤3的具体实施例流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步详细的说明。
本发明提出的一种基于手机信令数据的人口分布判断方法,如图1所示,通过以下步骤实现:
步骤S1:提取手机信令数据中的用户标识、时间戳和位置信息,建立用户的数据集合N。
提取手机信令数据中的有效信息,这里主要包括用户标识,时间戳和位置信息,并按照用户标识和时间戳对数据进行排序,得到对于单一用户总计D天(其中工作日Dw天)的数据集合{pi,ti},1≤i≤n,n=|N|。
上述,ti表示用户第i条数据记录的时间戳,pi表示用户第i条数据记录的位置点,用户的完整数据集合为N。
步骤S2:剔除数据集合N的噪声数据,得到更新的数据集合N。
如图2所示,本步骤具体包括:
S21:提取数据集合N中出现记录数最多的位置点m的所有记录,生成数据集合Nm={pm,ti}。
将步骤S1中排序后的数据集合N设为当前数据集,设置时间段集合T,原始为空集。
寻找当前数据集N中出现记录数最多的位置点m,提取位置为m的所有记录,生成新的数据集Nm={pm,ti}。
步骤S22:遍历并提取数据集合Nm中时间戳间隔小于δt的相邻数据的所有时间段,生成集合T。
遍历数据集合Nm中的数据,若相邻两条数据时间戳间隔小于δt,即(tj+1-tj)≤δt,则将时间段更新至集合T,即T=Uj(tj,tj+1),执行后得到时间段集合T。
δt的取值根据不同方式居民出行平均时耗来确定,不宜低于居民一次出行所需的最短时耗(约15分钟)。
步骤S23:对比数据集合N中记录的所有时间戳,若且pi≠pm,则将pi更新为pm,并加入到数据集合Nm中。
旨在选出时间点在规定的时间间隔内,但位置点不同于pm的点,认为这个位置点也应该是pm
步骤S24:去除数据集合N中属于数据集合Nm的数据。
去除数据集合N中属于数据集合Nm的数据,然后对数据集合N循环上述步骤,直至当前数据集合N中没有数据,形成新的数据集合Nm
步骤S25:将新的数据集合Nm中的数据按照ti排序,将位置点相同的所有相邻数据合并为一条新的数据,记录为{pi,tis,tie},得到新的数据集合N。
上述,tis为所合并数据中最小时间戳,tie为所合并数据中最大时间戳,相邻无相同位置的点,ti=tis=tie
经过该步骤S2,基本可将夹杂在有效数据中的噪声数据提出,且在下一步判断中,将未被剔除的噪声数据影响降至最低。
现有技术的算法中,数据清洗流程中需要对数据进行多次遍历且需要多个参数用以数据清洗,会产生大量的位置点,在实际应用过程中,需要对数据进行二次处理,才能保证使用效率,而本步骤中仅对数据进行一次遍历,并仅用一个参数δt即可完成数据清洗,除原有基站位置外,不会产生更过的位置点,节省了坐标重计算的运算量,提高了数据清洗效率,降低了过多参数对数据清洗效果的影响。
步骤S3、基于更新的数据集合N中的数据,得到用户每天在各个基站的停留时长,结合单日活跃时长阈值与累计活跃天数阈值两项判断标准识别职住地。
具体的,如图3所示,包括如下步骤:
步骤S31:筛选居住地识别时间范围内的数据集合Nh,以及工作地识别时间范围内的数据集合Nw
在本发明的一个具体实施例中,参考用户的普遍作息规律,将居住地识别时间范围定为th={00:00-6:00},工作地识别时间范围定为tw={9:00-18:00}。
针对更新的数据集合N,筛选出在th={00:00-6:00}范围内的数据形成集合Nh,筛选出在tw={9:00-18:00}范围内的数据形成集合tw
步骤S32:针对Nh和Nw,分别统计同一基站的居住地活跃天数和工作地活跃天数。
本发明实施例中,设置单日居住活跃阈值为Rhome,例如4小时,设置单日工作活跃阈值为Rwork,例如6小时。
若数据集合Nh中的基站pj满足:单日在th时间段中停留累积时间大于单日居住活跃阈值Rhome,则该基站的居住活跃天数AHpj累加1,0≤AHpj≤D,并累计停留时间SHpj=∑i∈j(tie-tis),将累计停留时间加入集合SHi
若数据集合Nw中的基站pj满足:单日在tw时间段中停留累积时间大于单日工作活跃阈值Rwork,则该基站工作活跃天数AWpj累加1,0≤AWpj≤D,并累计停留时间SWpj=∑i∈j(tie-tis),将累计停留时间加入集合SWi
步骤S33:选取居住地活跃天数大于居住活跃天数阈值,且累计活跃时长最大的基站为居住地所在基站,以及,选取工作地活跃天数大于工作活跃天数阈值,且累计活跃时长最大的基站为工作地所在基站。
本发明实施例中,设置居住活跃天数阈值为为居住活跃天数占所有天数D的占比,例如0.6,设置工作活跃天数阈值为/>为工作活跃天数占工作天数Dw的占比,例如0.5。
选取且累计活跃时长最大的基站,也即SHpj=max(SHi)的基站pj为用户居住地所在基站。若没有基站满足上述条件,则居住地识别为空,即该用户非常驻人口。
选取且累计活跃时长最大的基站,也即SWpj=max(SWi)的基站pj为用户工作地所在基站。若没有基站满足上述条件,则工作地识别为空,即该用户非工作人口。
应该指出的是,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (1)

1.一种基于手机信令数据的人口分布判断方法,其特征在于,通过以下步骤实现:
步骤1、提取手机信令数据中的用户标识、时间戳和位置信息,建立用户的数据集合N;
步骤2、剔除数据集合N的噪声数据,得到更新的数据集合N;
步骤3、基于更新的数据集合N中的数据,得到用户每天在各个基站的停留时长,结合单日活跃时长阈值与累计活跃天数阈值两项判断标准识别职住地;
所述步骤1具体包括:
按照用户标识和时间戳对数据进行排序,得到对于单一用户总计D天的数据集合N={pi,ti},1≤i≤n,n=|N|;其中ti表示用户第i条数据记录的时间戳,pi表示用户第i条数据记录的位置点;
所述步骤2具体包括:
提取数据集合N中出现记录数最多的位置点m的所有记录,生成数据集合Nm={pm,ti};
遍历并提取数据集合Nm中时间戳间隔小于δt的相邻数据的所有时间段,生成集合T;
对比数据集合N中记录的所有时间戳,若且pi≠pm,则将pi更新为pm,并加入到数据集合Nm中;
去除数据集合N中属于数据集合Nm的数据,循环上述步骤,直至当前数据集合N中没有数据,形成新的数据集合Nm
将新的数据集合Nm中的数据按照ti排序,将位置点相同的所有相邻数据合并为一条新的数据,记录为{pi,tis,tie},得到新的数据集合N;其中,tis为所合并数据中最小时间戳,tie为所合并数据中最大时间戳;
所述步骤3包括:
筛选居住地识别时间范围内的数据集合Nh,以及工作地识别时间范围内的数据集合Nw
针对Nh和Nw,分别统计同一基站的居住地活跃天数和工作地活跃天数;
选取居住地活跃天数大于居住活跃天数阈值,且累计活跃时长最大的基站为居住地所在基站,以及,选取工作地活跃天数大于工作活跃天数阈值,且累计活跃时长最大的基站为工作地所在基站;
所述单日活跃时长阈值包括单日居住活跃阈值Rhome和单日工作活跃阈值Rwork;所述累计活跃天数阈值包括居住活跃天数阈值和工作活跃天数阈值/>则所述步骤3具体包括:
提取用户每天在th时间段的数据,得到数据集合Nh;以及,提取用户每天在tw时间段的数据,得到数据集合Nw;th时间段为居住地识别时间范围,tw时间段为工作地识别时间范围;
若数据集合Nh中的基站pj满足:单日在th时间段中停留累积时间大于单日居住活跃阈值Rhome,则所述基站的居住活跃天数AHpj累加1,0≤AHpj≤D,并累计停留时间SHpj=∑i∈j(tie-tis),将累计停留时间加入集合SHi
若数据集合Nw中的基站pj满足:单日在tw时间段中停留累积时间大于单日工作活跃阈值Rwork,则所述基站工作活跃天数AWpj累加1,0≤AWpj≤D,并累计停留时间SWpj=∑i∈j(tie-tis),将累计停留时间加入集合SWi
选取且SHpj=max(SHi)的基站pj为用户居住地所在基站;
选取且SWpj=max(SWi)的基站pj为用户工作地所在基站。
CN202010820016.2A 2020-08-14 2020-08-14 一种基于手机信令数据的人口分布判断方法 Active CN112001829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010820016.2A CN112001829B (zh) 2020-08-14 2020-08-14 一种基于手机信令数据的人口分布判断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010820016.2A CN112001829B (zh) 2020-08-14 2020-08-14 一种基于手机信令数据的人口分布判断方法

Publications (2)

Publication Number Publication Date
CN112001829A CN112001829A (zh) 2020-11-27
CN112001829B true CN112001829B (zh) 2024-03-12

Family

ID=73473700

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010820016.2A Active CN112001829B (zh) 2020-08-14 2020-08-14 一种基于手机信令数据的人口分布判断方法

Country Status (1)

Country Link
CN (1) CN112001829B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112866920B (zh) * 2021-01-07 2022-06-07 东南大学 一种利用核函数处理手机信令数据识别就业地的方法
CN113556697B (zh) * 2021-07-21 2022-04-26 智慧足迹数据科技有限公司 基于手机信令的快递员识别方法及相关装置
US20230334068A1 (en) * 2021-08-20 2023-10-19 Boe Technology Group Co., Ltd. Data processing method and apparatus thereof, electronic device, and computer-readable storage medium
CN114153899A (zh) * 2021-11-30 2022-03-08 南京大学 一种获取不同用地类型单位建筑面积就业岗位数的方法、电子设备
CN115086879B (zh) * 2022-08-22 2022-12-16 广州市城市规划勘测设计研究院 轨道交通站客流特征及接驳方式的识别方法、装置及设备
CN116957520B (zh) * 2023-09-20 2023-12-26 北京融信数联科技有限公司 一种基于大数据的失业率监测方法、系统和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105142106A (zh) * 2015-07-29 2015-12-09 西南交通大学 基于手机信令数据的出行者职住地识别与出行链刻画方法
CN106570184A (zh) * 2016-11-11 2017-04-19 同济大学 从手机信令数据提取游憩‑居住联系数据集的方法
CN107133318A (zh) * 2017-05-03 2017-09-05 北京市交通信息中心 一种基于手机信令数据的人口识别方法
CN109583640A (zh) * 2018-11-23 2019-04-05 东南大学 一种基于多源定位数据的城市出行客流属性识别方法
CN109918459A (zh) * 2019-01-28 2019-06-21 同济大学 一种基于手机信令的城市中观层面实有人口统计方法
CN110930285A (zh) * 2020-02-05 2020-03-27 北京交研智慧科技有限公司 一种人口分布分析方法及装置
CN110990443A (zh) * 2019-10-28 2020-04-10 上海城市交通设计院有限公司 一种基于手机信令的职住人口特征估算方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105142106A (zh) * 2015-07-29 2015-12-09 西南交通大学 基于手机信令数据的出行者职住地识别与出行链刻画方法
CN106570184A (zh) * 2016-11-11 2017-04-19 同济大学 从手机信令数据提取游憩‑居住联系数据集的方法
CN107133318A (zh) * 2017-05-03 2017-09-05 北京市交通信息中心 一种基于手机信令数据的人口识别方法
CN109583640A (zh) * 2018-11-23 2019-04-05 东南大学 一种基于多源定位数据的城市出行客流属性识别方法
CN109918459A (zh) * 2019-01-28 2019-06-21 同济大学 一种基于手机信令的城市中观层面实有人口统计方法
CN110990443A (zh) * 2019-10-28 2020-04-10 上海城市交通设计院有限公司 一种基于手机信令的职住人口特征估算方法
CN110930285A (zh) * 2020-02-05 2020-03-27 北京交研智慧科技有限公司 一种人口分布分析方法及装置

Also Published As

Publication number Publication date
CN112001829A (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN112001829B (zh) 一种基于手机信令数据的人口分布判断方法
CN106912015B (zh) 一种基于移动网络数据的人员出行链识别方法
CN110245981B (zh) 一种基于手机信令数据的人群类型识别方法
CN103116696B (zh) 基于稀疏采样的手机定位数据的人员常驻地点识别方法
CN111464950B (zh) 一种使用手机信令数据提取出行停驻点的方法
CN110930285A (zh) 一种人口分布分析方法及装置
CN111294742B (zh) 基于信令cdr数据识别伴随手机号码的方法与系统
CN110134865B (zh) 一种基于城市公共交通出行大数据的通勤乘客社交推荐方法及平台
CN109729518B (zh) 基于手机信令的城市交通早高峰拥堵源头识别方法
CN110990443A (zh) 一种基于手机信令的职住人口特征估算方法
CN108108897B (zh) 一种轨道交通客流清分方法、系统及电子设备
Shi et al. Analysis of trip generation rates in residential commuting based on mobile phone signaling data
CN106504524A (zh) 一种基于移动信令动态划分高速公路路段的方法
CN111797145A (zh) 一种电力客户容忍度评价分类方法
Li et al. Estimating crowd flow and crowd density from cellular data for mass rapid transit
CN116629460B (zh) 一种基于ST-RANet模型的地铁客流预测方法
CN116703132B (zh) 共享车辆动态调度的管理方法、装置及计算机设备
Klimek et al. Towards a better understanding and behavior recognition of inhabitants in smart cities. A public transport case
CN112188478A (zh) 基于大数据分析的常驻人口数据采集方法
CN116668958A (zh) 基于手机信令数据的城市居民动态od矩阵提取方法
CN111275073A (zh) 一种基于手机信令数据的区域人流分析方法
CN116993391A (zh) 一种站点式共享单车系统使用需求预测方法
CN110933601A (zh) 目标区域确定方法、装置、设备和介质
CN113112795B (zh) 一种路况预测方法、装置及设备
CN103945488A (zh) 基于地理位置的网络社区构建方法及网络节点

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant