CN111026738A - 区域人口监控方法、系统、电子设备及存储介质 - Google Patents
区域人口监控方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111026738A CN111026738A CN201911085376.6A CN201911085376A CN111026738A CN 111026738 A CN111026738 A CN 111026738A CN 201911085376 A CN201911085376 A CN 201911085376A CN 111026738 A CN111026738 A CN 111026738A
- Authority
- CN
- China
- Prior art keywords
- population
- user
- data
- area
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 30
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 27
- 230000002159 abnormal effect Effects 0.000 claims abstract description 23
- 230000011664 signaling Effects 0.000 claims abstract description 20
- 238000004140 cleaning Methods 0.000 claims abstract description 7
- 230000000737 periodic effect Effects 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 15
- 230000007774 longterm Effects 0.000 claims description 13
- 238000009499 grossing Methods 0.000 claims description 12
- 238000013508 migration Methods 0.000 claims description 12
- 230000005012 migration Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 230000001932 seasonal effect Effects 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000000087 stabilizing effect Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001617 migratory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/18—Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
- H04W8/183—Processing at user equipment or user record carrier
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Economics (AREA)
- Signal Processing (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Computer Networks & Wireless Communication (AREA)
- Health & Medical Sciences (AREA)
- Remote Sensing (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Mobile Radio Communication Systems (AREA)
- Alarm Systems (AREA)
Abstract
本发明公开了一种区域人口监控方法,对手机信令数据进行清洗、转换、序列化,构建手机用户的基站切换序列,关联基站的所属区域关系配置,得到手机用户在所属区域内的打点时序和时长;建立一包括多个人口指标的指标池;观察用户预设时长的长周期内的打点记录,删除无用数据,获得区域内数据;将运营商登记的用户身份信息与区域内数据通过手机号作为主键进行关联匹配,识别所属区域内的户籍人口,计算监测时段内户籍人口数;运用时间序列分解算法监测关键指标、进行异常值告警。本发明可以从多方面、全面的监控人口数据,可以有效的消除部分数据异常或数据丢失带来的干扰,持续优化模型算法,避免基础数据丢失不全等情况。
Description
技术领域
本发明涉及计算机大数据技术领域,特别涉及一种区域人口监控方法、系统、电子设备及存储介质。
背景技术
常住人口、稳定人口、流动人口、迁徙人口和户籍人口等都是反映宏观人口规模、人口的动态潮汐变化以及流动情况的重要观察指标,经过人口统计,可以揭示人口过程的规律性和人口现象的本质。通过人口统计,可以为控制人口数量,提高人口素质服务,使人口发展同经济和社会的发展相适应。现有的人口统计及监控通过运营商位置基站数据统计区域单一人口数。但是现有的人口统计方法使用的单个指标反映的问题往往过于片面,不能真实反映区域人口规模及人流动态。且运营商的存在一些异常数据,少量数据异常或数据丢失会带来异常干扰,影响统计结果的精确性。
发明内容
本发明要解决的技术问题是如何提供一种全面且精确监控区域人口的区域人口监控方法、系统、电子设备及存储介质。
为了解决上述技术问题,本发明的技术方案为:
第一方面,一种区域人口监控方法,包括步骤:
S10:对手机信令数据进行清洗、转换、序列化,构建手机用户的基站切换序列,关联基站的所属区域关系配置,得到手机用户在所属区域内的打点时序和时长;
S20:建立一包括多个人口指标的指标池;
S30:观察用户预设个的时间周期内的打点记录,当被判定为停留在一区域内的周期的比例超过阈值时,判定该用户为所述区域内的用户,滤除所述区域外的数据;
S40:将运营商登记的用户身份信息与所述区域内数据通过手机号作为主键进行关联匹配,识别所属区域内的户籍人口,计算监测时段内户籍人口数;
S50:运用时间序列分解算法监测关键指标、进行异常值告警。
优选地,步骤S10的过程包括:
获取全网用户的手机信令数据,过滤物联网卡及用户标识缺失信令,按用户、时间顺序排序,剔除连续冗余基站信令,生成手机用户基站打点时序时长的结果集一;
根据全国行政区的边界线,为每个行政区街乡镇处理出一组边界拐点经纬度信息的结果集二;
将结果集一和结果集二的经纬度信息进行比较匹配,识别出基站的所属行政区,根据用户基
优选地,步骤S30的过程包括:
在预设周期内,将一区域内出现的时间超过预设时长的用户定义为疑似区域标签用户;
观测连续N个预设周期内区域内的用户,将在近N个时段内有超过M个时段都为该区域疑似标签用户的用户确定为区域标签用户,其中M小于或等于N。
优选地,所述指标池包括:
常住人口,包括工作人口、居住人口、职住不重合的工作用户、职住重合工作用户、长期居住用户、长期职住不重合工作用户、长期职住重合用户、职住矩阵、职住特征;
稳定人口;
流动人口,包括流动人口、流入人口及流出人口;
迁徙人口,包括工作用户迁徙、居住用户迁徙、职住不重合用户迁徙及职住重合用户迁徙;
以及户籍人口。
优选地,步骤S50包括:
S51:提取时间序列数据,确定趋势成分;
S52:数据输入模型,进行异常检测;
S53:结合算法结果及预设条件,输出异常数据。
优选地,步骤S52包括:
S521:使用时间序列分解,将计数列分解为:观察列、季节列、趋势列和剩余列;
S522:使用平滑器进行季节性分解;对分解的数据执行STL内循环,对数据进行趋势拟合及周期分量计算;
S523:进行STL外循环,在默认参数设置情况下进行SRL分解,产生:上限、下限、异常三列新数据;在检测异常时,对默认参数进行设置。
优选地,步骤S522具体为:去趋势,减去上一轮结果的趋势分量;周期子序列平滑,用LOESS对每个子序列做回归,并向前向后各延展一个周期,平滑结果组成临时季节性序列;周期子序列的低通量过滤,对上一个步骤的结果序列依次做滑动平均,然后做LOESS回归,得到结果序列;去除平滑周期子序列趋势;去周期,减去周期分量;趋势平滑,对于去除周期之后的序列做LOESS回归,得到趋势分量。
第二方面,本发明还提出一种区域人口监控系统,所述区域人口监控系统包括:
区域匹配模块:对手机信令数据进行清洗、转换、序列化,构建手机用户的基站切换序列,关联基站的所属区域关系配置,得到手机用户在所属区域内的打点时序和时长;
指标池模块:建立一包括多个人口指标的指标池;
过滤模块:观察用户预设时长的周期内的打点记录,删除预设指标在阈值范围外的数据,获得区域内数据;
匹配模块:将运营商登记的用户身份信息与所述区域内数据通过手机号作为主键进行关联匹配,识别所属区域内的户籍人口,计算监测时段内户籍人口数;
STL模块:运用时间序列分解算法监测关键指标、进行异常值告警。
第三方面,本发明还提出了一种区域人口监控电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的区域人口监控方法的步骤。
第四方面,本发明还提出了一种区域人口监控的计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时间实现上述的区域人口监控方法的步骤。
采用上述技术方案,建立一包括多个人口指标的指标池,使得人口的评价监控指标不再单一,可以从多方面、全面的监控人口数据。本发明技术方案观察用户预设时长的周期内的打点记录,删除预设指标在阈值范围外的数据,可以有效的消除部分数据异常或数据丢失带来的干扰,持续优化模型算法,避免基础数据丢失不全等情况。此外,本技术方案还运用STL算法监测关键指标、进行异常值告警,实现自动的准确监控。
附图说明
图1为本发明区域人口监控方法一实施例的流程图;
图2为本发明区域人口监控方法一实施例中进行异常检测的流程图;
图3为本发明一实施例中的人口折线图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。
参照图1,本发明实施例提出了一种区域人口监控方法,包括步骤:
S10:对手机信令数据进行清洗、转换、序列化,构建手机用户的基站切换序列,关联基站的所属区域关系配置,得到手机用户在所属区域内的打点时序和时长;
获取全网用户的手机信令数据,过滤物联网卡及用户标识缺失信令,按用户、时间顺序排序,剔除连续冗余基站信令,生成手机用户基站打点时序时长的结果集一;根据全国行政区的边界线,运用工具程序为每个行政区街乡镇处理出一组边界拐点经纬度信息的结果集二;将结果集一和结果集二的经纬度信息进行比较匹配,识别出基站的所属行政区,根据用户基。
S20:建立一包括多个人口指标的指标池;指标池包括:常住人口,包括工作人口、居住人口、职住不重合的工作用户、职住重合工作用户、长期居住用户、长期职住不重合工作用户、长期职住重合用户、职住矩阵、职住特征;稳定人口;流动人口,包括流动人口、流入人口及流出人口;迁徙人口,包括工作用户迁徙、居住用户迁徙、职住不重合用户迁徙及职住重合用户迁徙;户籍人口。
S30:观察用户预设个的时间周期内的打点记录,当被判定为停留在一区域内的周期的比例超过阈值时,判定该用户为所述区域内的用户,滤除所述区域外的数据;在预设周期内,将一区域内出现的时间超过预设时长的用户定义为疑似区域标签用户;观测连续N个预设周期内区域内的用户,将在近N个时段内有超过M个时段都为该区域疑似标签用户的用户确定为区域标签用户,其中M小于或等于N。
S40:将运营商登记的用户身份信息与区域内数据通过手机号作为主键进行关联匹配,识别所属区域内的户籍人口,计算监测时段内户籍人口数;
S50:运用时间序列分解(STL,Seasonal and Trend decomposition usingLoess)算法监测关键指标、进行异常值告警。具体包括:
S51:提取时间序列数据,确定趋势成分;
参照图2,S52:数据输入模型,进行异常检测;
S521:使用时间序列分解,将计数列分解为:观察列、季节列、趋势列和剩余列;
S522:使用平滑器进行季节性分解;对分解的数据执行STL内循环,对数据进行趋势拟合及周期分量计算;去趋势,减去上一轮结果的趋势分量;周期子序列平滑,用LOESS对每个子序列做回归,并向前向后各延展一个周期,平滑结果组成临时季节性序列;周期子序列的低通量过滤,对上一个步骤的结果序列依次做滑动平均,然后做LOESS回归,得到结果序列;去除平滑周期子序列趋势;去周期,减去周期分量;趋势平滑,对于去除周期之后的序列做LOESS回归,得到趋势分量。
S523:进行STL外循环,在默认参数设置情况下进行SRL分解,产生:上限、下限、异常三列新数据;在检测异常时,对默认参数进行设置。
S53:结合算法结果及预设条件,输出异常数据。
在输出经过模型算法输出结果后,使用者在结合实际业务指导实际作业。例如针对某区域进行人才引进。再或者,某区域人口数严重超负载且从事低端行业群体较多,则需要识别到具体群体并针对性劝离达到人口有效疏解。
采用上述技术方案,建立一包括多个人口指标的指标池,使得人口的评价监控指标不再单一,可以从多方面、全面的监控人口数据;本发明技术方案观察用户预设时长的周期内的打点记录,删除预设指标在阈值范围外的数据,可以有效的消除部分数据异常或数据丢失带来的干扰,持续优化模型算法,避免基础数据丢失不全等情况。此外,本技术方案还运用STL算法监测关键指标、进行异常值告警,实现自动的准确监控。
以北京朝阳区为例,本发明的另一实施例中,进行人口监控及统计的过程为:
(1.1)获取全网用户2/3/4G手机信令数据,过滤物联网卡和用户标识缺失信令,按用户、时间顺序排序,剔除连续冗余基站信令,生成手机用户基站打点时序时长记为结果集一;
(1.2)根据全国划分的行政区街乡镇边界线,运用工具程序为每个行政区街乡镇处理出一组边界拐点经纬度信息集记为结果集二;
(1.3)将结果集一和结果集二的经纬度信息进行比较匹配,识别出基站小区归属行政区或街乡镇,此时根据用户基站打点时序时长能映射出用户区域打点时序时长。
优选的,步骤(2)中建立人口指标池方法为:
(2.1)通过多次对接多个政府委办局单位,为满足不同单位多种不同业务场景需求,确定建立一个涵盖超过20个人口指标的指标池。主要关键指标有:常住人口(工作人口、居住人口、工作用户(职住不重合)、职住重合用户、长期居住用户、长期工作用户(职住不重合)、长期职住重合用户、职住矩阵、职住特征)、稳定人口、流动人口(流动人口、流入人口、流出人口)、迁徙人口(工作用户迁徙、居住用户迁徙、职住不重合用户迁徙、职住重合用户迁徙)、户籍人口;
优选的,步骤(3)中长时间的数据观察学习矫正沉淀模型方法为:
(3.1)处理步骤(1)的结果集,根据模型口径筛选某时段某区域内出现一定时长的用户定义为疑似区域标签用户,如疑似区域常住人口定义是周期内用户累计在区域工作天数或居住天数在X天以上,每日工作时段或夜间居住时段在该区域停留时长最长;
(3.2)基于多种客观原因,如时段内信令数据发生延迟推送、机房超负载短暂性断电都将导致(2.1)的数据统计不准确,此时延长观察周期,观测连续N个时段内区域疑似标签用户人群,根据多次探查比较矫正,确定标签用户模型口径为在近N个时段内有超过M(M<=N)个时段都为该区域疑似标签用户;
具体的,步骤(4)中关联身份证信息统计区域户籍人口方法为:
(4.1)获取运营商实名认证登记的用户身份证信息,记为结果集一;
(4.2)将步骤(1)中结果集和(4.1)结果集一通过手机号等主键关联匹配,识别出区域内户籍人口并计算出监测时段内户籍人口数;
优选的,步骤(5)中运用时间序列分解算法监测关键指标、异常值告警方法,根据STL分解法(STL分解法分为内循环和外循环)流程,实际算法实施步骤如下:
(5.1)提取时间序列数据,确定趋势成分。
根据(1.1),(2.1)(3.1)(4.1)步骤计算得各类人口数据,提取需要进行监控的区域人口数据,相关数据如下表:
将下表绘制成折线图,如图3所示。
上表可知,朝阳区人口数时间序列存在趋势,且趋势为线性趋势,且存在季节性,故可进行时间序列分解法。
(5.2)数据输入模型,进行异常检测。
(5.2.1)使用时间序列分解,将“计数”列分解为“观察”列,“季节”列,“趋势”列和“剩余”列,
使用平滑器进行季节性分解。
(5.2.2)对分解的数据执行异常检测即执行STL内循环过程,对数据进行趋势拟合及周期分量计算,尤其为“余数”列。内循环步骤分为6个步骤:
Step 1:去趋势(Detrending),减去上一轮结果的趋势分量;
Step 2:周期子序列平滑(Cycle-subseries smoothing),用LOESS对每个子序列做回归,并向前向后各延展一个周期;平滑结果组成temporary seasonal series;
Step 3:周期子序列的低通量过滤(Low-Pass Filtering),对上一个步骤的结果序列依次做滑动平均(moving average),然后做LOESS回归,得到结果序列
Step 4:去除平滑周期子序列趋势(Detrending of Smoothed Cycle-subseries);
Step 5:去周期(Deseasonalizing),减去周期分量;
Step 6:趋势平滑(Trend Smoothing),对于去除周期之后的序列做LOESS回归,得到趋势分量。
(5.2.3)内循环结束后进行robustness weight的计算即进行STL外循环。在默认参数设置情况下进行SRL分解,最终产生三列新数据,“上限”,“下限”,“异常”(是否为异常的标志)。在检测异常时,对相关默认参数进行设置,以达到快速且相对准确的效果。
(5.3)结合算法结果及理论知识,输出异常数据。通过,围绕“观察”值,进行上限及下限的修正,同时加入业务知识,结合实际情况进行相应上限与下限的判断。上文举例数据中,最终结果数据为201802数据为异常数据,异常原因为大规模春运返乡行为。
具体地,步骤(6)中结合业务理解指导实际作业方法为:
(6.1)步骤(5)通过算法判断出当前人口值是否在算法预设的正常区间波动,其中正常波动区间是根据业务场景需求提前定义好的,可能是正常高值、正常值或正常低值;
(6.2)经过算法处理输出结果后需要结合业务理解才能解读实际现状,从而有效指导实际作业。如某区域人口数严重超负载且从事低端行业群体不少,需要识别到具体群体并针对性劝离达到人口有效疏解。此时则需要通过算法监测区域常住人口数,算法预设的正常波动区间为正常高值区间,此时算法处理输出结果时不抛出异常,则说明区域常驻人口值仍持续在高值区间,仍需持续疏解;如果算法监测结果为人数值是异常偏低情况,则说明常住人口数开始下降、疏解小有成效。
本发明的目的在于针对已有的通过运营商位置基站数据统计区域单一人口数的现状,优化了一种对基站位置数据的长观察学习、矫正去噪、优化模型算法,结合人口指标池的监测体系的建立,实现对多种类型人口数量的科学统计。同时,运用时间序列分解算法(STL分解法),输入关键指标人口值的时间序列,如近2年每月常驻人口数量的时间序列,算法输出序列内的异常值,实现对指标的异常检测效果,再结合业务理解指导实际操作,真实掌握区域宏观人口规模、判断区域人口数量是否控制在正常范围、人口压力是否得到有效疏解等。该方法采用大数据处理技术,通过后台任务程序化执行,定期输出常住人口、稳定人口、流动人口和户籍人口等人口值,再经过STL分解法长周期监测人口数是否在范围内波动,并在异常值情况下及时抛出异常提醒。
本发明无需额外相关的设备资源,无需实时同步用户位置数据且允许客观存在的原始数据丢失。本发明通过长期观察基站位置数据,结合人口指标池监测体系,通过计算用户周期内在区域出现的时间段和停留时长,识别出区域内常驻人口、稳定人口和流动人口等,同时结合用户开户实名制登记的身份证号码信息,识别出区域内户籍人口,再通过运用STL分解算法实现对区域人口的长期监测效果,最后结合业务理解指导实际操作。
第二方面,本发明还提出一种区域人口监控系统,区域人口监控系统包括:
区域匹配模块:对手机信令数据进行清洗、转换、序列化,构建手机用户的基站切换序列,关联基站的所属区域关系配置,得到手机用户在所属区域内的打点时序和时长;
指标池模块:建立一包括多个人口指标的指标池;
过滤模块:观察用户预设时长的周期内的打点记录,删除预设指标在阈值范围外的数据,获得区域内数据;
匹配模块:将运营商登记的用户身份信息与区域内数据通过手机号作为主键进行关联匹配,识别所属区域内的户籍人口,计算监测时段内户籍人口数;
STL模块:运用时间序列分解算法监测关键指标、进行异常值告警。
第三方面,本发明还提出了一种区域人口监控电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述的区域人口监控方法的步骤。
第四方面,本发明还提出了一种区域人口监控的计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时间实现上述的区域人口监控方法的步骤。
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。
Claims (10)
1.一种区域人口监控方法,其特征在于,包括步骤:
S10:对手机信令数据进行清洗、转换、序列化,构建手机用户的基站切换序列,关联基站的所属区域关系配置,得到手机用户在所属区域内的打点时序和时长;
S20:建立一包括多个人口指标的指标池;
S30:观察用户预设个的时间周期内的打点记录,当被判定为停留在一区域内的周期的比例超过阈值时,判定该用户为所述区域内的用户,滤除所述区域外的数据;
S40:将运营商登记的用户身份信息与所述区域内数据通过手机号作为主键进行关联匹配,识别所属区域内的户籍人口,计算监测时段内户籍人口数;
S50:运用时间序列分解算法监测关键指标、进行异常值告警。
2.根据权利要求1所述的区域人口监控方法,其特征在于,步骤S10的过程包括:
获取全网用户的手机信令数据,过滤物联网卡及用户标识缺失信令,按用户、时间顺序排序,剔除冗余基站信令,生成手机用户基站打点时序时长的结果集一;
根据全国行政区的边界线,为每个行政区街乡镇处理出一组边界拐点经纬度信息的结果集二;
将结果集一和结果集二的经纬度信息进行比较匹配,识别出基站的所属行政区,根据用户基站打点时序时长映射出用户区域打点时序时长。
3.根据权利要求1所述的区域人口监控方法,其特征在于,步骤S30的过程包括:
在预设周期内,将一区域内出现的时间超过预设时长的用户定义为疑似区域标签用户;
观测连续N个预设周期内区域内的用户,将在近N个时段内有超过M个时段都为该区域疑似标签用户的用户确定为区域标签用户,其中M小于或等于N。
4.根据权利要求1所述的区域人口监控方法,其特征在于,所述指标池包括:
常住人口,包括工作人口、居住人口、职住不重合的工作用户、职住重合工作用户、长期居住用户、长期职住不重合工作用户、长期职住重合用户、职住矩阵、职住特征;
稳定人口;
流动人口,包括流动人口、流入人口及流出人口;
迁徙人口,包括工作用户迁徙、居住用户迁徙、职住不重合用户迁徙及职住重合用户迁徙;
户籍人口。
5.根据权利要求1所述的区域人口监控方法,其特征在于,步骤S50包括:
S51:提取时间序列数据,确定趋势成分;
S52:数据输入模型,进行异常检测;
S53:结合算法结果及预设条件,输出异常数据。
6.根据权利要求5所述的区域人口监控方法,其特征在于,步骤S52包括:
S521:使用时间序列分解,将计数列分解为:观察列、季节列、趋势列和剩余列;
S522:使用平滑器进行季节性分解;对分解的数据执行STL内循环,对数据进行趋势拟合及周期分量计算;
S523:进行STL外循环,在默认参数设置情况下进行SRL分解,产生:上限、下限、异常三列新数据;在检测异常时,对默认参数进行设置。
7.根据权利要求6所述的区域人口监控方法,其特征在于,步骤S522具体为:去趋势,减去上一轮结果的趋势分量;周期子序列平滑,用LOESS对每个子序列做回归,并向前向后各延展一个周期,平滑结果组成临时季节性序列;周期子序列的低通量过滤,对上一个步骤的结果序列依次做滑动平均,然后做LOESS回归,得到结果序列;去除平滑周期子序列趋势;去周期,减去周期分量;趋势平滑,对于去除周期之后的序列做LOESS回归,得到趋势分量。
8.一种区域人口监控系统,其特征在于,所述区域人口监控系统包括:
区域匹配模块:对手机信令数据进行清洗、转换、序列化,构建手机用户的基站切换序列,关联基站的所属区域关系配置,得到手机用户在所属区域内的打点时序和时长;
指标池模块:建立一包括多个人口指标的指标池;
过滤模块:观察用户预设时长的周期内的打点记录,删除预设指标在阈值范围外的数据,获得区域内数据;
匹配模块:将运营商登记的用户身份信息与所述区域内数据通过手机号作为主键进行关联匹配,识别所属区域内的户籍人口,计算监测时段内户籍人口数;
STL模块:运用时间序列分解算法监测关键指标、进行异常值告警。
9.一种区域人口监控电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于:所述处理器执行所述程序时实现权利要求1-7任一项所述的区域人口监控方法的步骤。
10.一种区域人口监控的计算机可读存储介质,其上存储有计算机程序,其特征在于:该计算机程序被处理器执行时间实现权利要求1-7任一项所述的区域人口监控方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911085376.6A CN111026738A (zh) | 2019-11-08 | 2019-11-08 | 区域人口监控方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911085376.6A CN111026738A (zh) | 2019-11-08 | 2019-11-08 | 区域人口监控方法、系统、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111026738A true CN111026738A (zh) | 2020-04-17 |
Family
ID=70201010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911085376.6A Pending CN111026738A (zh) | 2019-11-08 | 2019-11-08 | 区域人口监控方法、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111026738A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111598441A (zh) * | 2020-05-14 | 2020-08-28 | 北京软通智城科技有限公司 | 人口数据分析方法、系统、设备和存储介质 |
CN111651727A (zh) * | 2020-05-29 | 2020-09-11 | 京东城市(北京)数字科技有限公司 | 一种区域间整体人口转移量的计算方法及装置 |
CN112000874A (zh) * | 2020-06-29 | 2020-11-27 | 福建慧政通信息科技有限公司 | 一种数字孪生城市人口管理方法和存储设备 |
CN112118548A (zh) * | 2020-07-29 | 2020-12-22 | 福建慧政通信息科技有限公司 | 一种大数据识别常住人口与流动人口的方法和存储设备 |
CN112712112A (zh) * | 2020-12-28 | 2021-04-27 | 中国移动通信集团江苏有限公司 | 区域流动人口识别方法、装置、设备及介质 |
CN113393353A (zh) * | 2021-06-11 | 2021-09-14 | 中国测绘科学研究院 | 基于ic卡数据的建筑物通勤人口估算方法及其存储介质 |
CN113743444A (zh) * | 2021-06-02 | 2021-12-03 | 京东城市(北京)数字科技有限公司 | 人群异常检测方法、装置、电子设备及存储介质 |
CN116567547A (zh) * | 2023-07-05 | 2023-08-08 | 北京融信数联科技有限公司 | 人口数据质量检验方法、系统和可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150088611A1 (en) * | 2013-09-24 | 2015-03-26 | Hendrik Wagenseil | Methods, Systems and Apparatus for Estimating the Number and Profile of Persons in a Defined Area Over Time |
CN107645740A (zh) * | 2017-09-01 | 2018-01-30 | 深圳市盛路物联通讯技术有限公司 | 一种移动监测方法及终端 |
CN108495254A (zh) * | 2018-03-06 | 2018-09-04 | 东南大学 | 一种基于信令数据的交通小区人口特征估计方法 |
CN109992605A (zh) * | 2019-03-14 | 2019-07-09 | 上海同济城市规划设计研究院有限公司 | 基于手机信令数据的人口识别方法及系统 |
CN110245981A (zh) * | 2019-05-31 | 2019-09-17 | 南京瑞栖智能交通技术产业研究院有限公司 | 一种基于手机信令数据的人群类型识别方法 |
-
2019
- 2019-11-08 CN CN201911085376.6A patent/CN111026738A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150088611A1 (en) * | 2013-09-24 | 2015-03-26 | Hendrik Wagenseil | Methods, Systems and Apparatus for Estimating the Number and Profile of Persons in a Defined Area Over Time |
CN107645740A (zh) * | 2017-09-01 | 2018-01-30 | 深圳市盛路物联通讯技术有限公司 | 一种移动监测方法及终端 |
CN108495254A (zh) * | 2018-03-06 | 2018-09-04 | 东南大学 | 一种基于信令数据的交通小区人口特征估计方法 |
CN109992605A (zh) * | 2019-03-14 | 2019-07-09 | 上海同济城市规划设计研究院有限公司 | 基于手机信令数据的人口识别方法及系统 |
CN110245981A (zh) * | 2019-05-31 | 2019-09-17 | 南京瑞栖智能交通技术产业研究院有限公司 | 一种基于手机信令数据的人群类型识别方法 |
Non-Patent Citations (3)
Title |
---|
KAIZONG YE: "时间序列分解和异常检测方法应用案例", 《HTTP://TECDAT.CN/?P=3232》, 26 July 2019 (2019-07-26), pages 3 - 5 * |
WEIXIN_34218579: "时间序列分解算法:STL", 《HTTPS://BLOG.CSDN.NET/ WEIXIN_34218579/ ARTICLE/DETAILS/85932182?》, 18 August 2017 (2017-08-18), pages 1 * |
丁达,毛焊琪,陆振波: "基于手机信令数据的人群类型识别研究", 《第十四届中国智能交通年会论文集》, 31 October 2019 (2019-10-31), pages 3 - 10 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111598441A (zh) * | 2020-05-14 | 2020-08-28 | 北京软通智城科技有限公司 | 人口数据分析方法、系统、设备和存储介质 |
CN111651727A (zh) * | 2020-05-29 | 2020-09-11 | 京东城市(北京)数字科技有限公司 | 一种区域间整体人口转移量的计算方法及装置 |
CN111651727B (zh) * | 2020-05-29 | 2023-09-26 | 京东城市(北京)数字科技有限公司 | 一种区域间整体人口转移量的计算方法及装置 |
CN112000874A (zh) * | 2020-06-29 | 2020-11-27 | 福建慧政通信息科技有限公司 | 一种数字孪生城市人口管理方法和存储设备 |
CN112118548A (zh) * | 2020-07-29 | 2020-12-22 | 福建慧政通信息科技有限公司 | 一种大数据识别常住人口与流动人口的方法和存储设备 |
CN112712112A (zh) * | 2020-12-28 | 2021-04-27 | 中国移动通信集团江苏有限公司 | 区域流动人口识别方法、装置、设备及介质 |
CN113743444A (zh) * | 2021-06-02 | 2021-12-03 | 京东城市(北京)数字科技有限公司 | 人群异常检测方法、装置、电子设备及存储介质 |
CN113393353A (zh) * | 2021-06-11 | 2021-09-14 | 中国测绘科学研究院 | 基于ic卡数据的建筑物通勤人口估算方法及其存储介质 |
CN116567547A (zh) * | 2023-07-05 | 2023-08-08 | 北京融信数联科技有限公司 | 人口数据质量检验方法、系统和可读存储介质 |
CN116567547B (zh) * | 2023-07-05 | 2023-12-01 | 北京融信数联科技有限公司 | 人口数据质量检验方法、系统和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111026738A (zh) | 区域人口监控方法、系统、电子设备及存储介质 | |
CN109034244B (zh) | 基于电量曲线特征模型的线损异常诊断方法及装置 | |
CN110929918A (zh) | 一种基于CNN和LightGBM的10kV馈线故障预测方法 | |
CN105677791A (zh) | 用于分析风力发电机组的运行数据的方法和系统 | |
CN107391515A (zh) | 基于关联规则分析的电力系统指标分析方法 | |
CN115865649B (zh) | 一种智能运维管理控制方法、系统和存储介质 | |
CN116258355B (zh) | 适用于多点功率估计的配电台区负荷曲线分解方法及装置 | |
CN111444075B (zh) | 一种自动发现关键影响力指标的方法 | |
CN112199805B (zh) | 一种输电线路隐患识别模型评估方法及装置 | |
CN115441456A (zh) | 一种电网调度支持系统故障诊断方法及装置 | |
CN105487970A (zh) | 一种界面展示方法及装置 | |
CN113988723A (zh) | 一种基于用电数据异常分析的用户行为锁定方法和系统 | |
CN110532122B (zh) | 故障分析方法及系统、电子设备、存储介质 | |
CN111179108A (zh) | 用电能耗的预测方法和装置 | |
CN112016856B (zh) | 综合倍率异常识别方法、装置、计量系统和存储介质 | |
CN111124816B (zh) | 一种基于hdp算法的服务器日志分析方法及系统 | |
CN112036634A (zh) | 光伏发电功率的确定方法、预测系统及可读存储介质 | |
CN110582091B (zh) | 定位无线质量问题的方法和装置 | |
CN117221910A (zh) | 用于无线网络优化的数据处理方法、装置、设备和介质 | |
CN116307886A (zh) | 一种企业生产状态的实时监测方法及装置 | |
CN107087284A (zh) | 一种网络小区的质量监控方法及监控系统、服务器 | |
CN114219245B (zh) | 基于大数据的乡村电力指数评价方法、装置及存储介质 | |
CN114665986B (zh) | 一种蓝牙钥匙的测试系统及方法 | |
CN110929800B (zh) | 一种基于sax算法的商业体异常用电检测方法 | |
CN104410873A (zh) | 电视频道用户数的检测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200417 |