CN111615054A - 人口分析方法及装置 - Google Patents
人口分析方法及装置 Download PDFInfo
- Publication number
- CN111615054A CN111615054A CN202010450781.XA CN202010450781A CN111615054A CN 111615054 A CN111615054 A CN 111615054A CN 202010450781 A CN202010450781 A CN 202010450781A CN 111615054 A CN111615054 A CN 111615054A
- Authority
- CN
- China
- Prior art keywords
- base station
- population
- administrative
- mobile terminal
- administrative division
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/023—Services making use of location information using mutual or relative location information between multiple location based services [LBS] targets or of distance thresholds
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
Abstract
本发明提供了一种人口分析方法及装置,其中,该方法包括:获取信令数据集和相应基站工参信息;获取相应基站所属行政区划的地图数据并据其计算相应基站位置与基站所属行政区划的边界的距离;若该距离不超过设定距离阈值,则为边界基站,从所有边界基站提取得到设定行政区划的边界基站集,根据基站的测量数据统计其中边界基站附着其所覆盖的各行政区划用户的比例;统计设定时间范围内边界基站附着用户数量和所有非边界基站附着用户数量,将各边界基站附着用户数量乘以相应比例并求和得到边界人口数量;对边界人口数量和所有非边界基站附着用户数量求和得到设定行政区划的总人口数量。通过上述方案能够更精确地对行政区划空间单元的人口统计分析。
Description
技术领域
本发明涉及人口统计技术领域,尤其涉及一种人口分析方法及装置。
背景技术
人口统计是对某一地区现有人口进行分析,例如,依据性别、年龄等常规因素进行分析。近年来,随着交通建设和城市协同发展策略的提出,对人口进行驻留和流动性分析具有越来越重要的研究意义。一个城市群的人口分析结果关系到地区行政管理规划、经济发展规划、社会治安管理等国计民生的方方面面。例如,京津冀一体化建设、港珠澳大湾区建设、上海大城市圈等城市协调发展战略的提出,对京津冀、港珠澳、上海大城市圈等城市群内不同城市之间人口的流动和驻留进行研究分析,对于相应城市群的职能规划、经济、文化、旅游等方面的协同发展具有重要意义。
当前针对城市群的人口分析方法主要包括传统的问卷调查和入户普查形式,以及利用交通卡口监控视频等技术进行分析方式。然而,问卷调查和入户普查形式耗时耗力,无法实时感知城市人口动态变化及城市群间人口流动的信息。利用交通卡口监控视频等技术的分析方式无法对一个区域的常住人口、流动人口、不同区域之间的人口流动性做精细化分析,且分析结果受天气、光线等客观因素的影响较大。
发明内容
有鉴于此,本发明提供了一种人口分析方法及装置,以解决现有技术中存在的一个或多个问题。
为了达到上述目的,本发明采用以下方案实现:
根据本发明实施例的一个方面,提供了一种人口分析方法,包括:
获取信令数据集;其中,所述信令数据集中的每条信令数据包括移动终端用户标识、基站标识、及时间戳;
获取信令数据中的基站标识对应的基站工参信息;其中,所述基站工参信息包括基站位置和基站所属行政区划;
获取基站工参信息中基站所属行政区划对应的地图数据,并根据所述地图数据和基站工参信息中的基站位置,计算基站位置与基站所属行政区划的边界的距离;
若基站位置与基站所属行政区划的边界的距离不超过设定距离阈值,则确定相应基站为边界基站,从所有基站所属行政区划的所有边界基站中提取得到设定行政区划的边界基站集;
获取边界基站集中边界基站的网络覆盖情况测量数据,根据网络覆盖情况测量数据统计边界基站附着其所覆盖的各行政区划的移动终端用户的比例;
针对所述信令数据集,统计时间戳在设定时间范围内且属于所述设定行政区划的边界基站集的各边界基站的基站标识对应的移动终端用户标识的数量和所有非边界基站的基站标识对应的移动终端用户标识的数量,将所述边界基站集中每个边界基站的基站标识对应的移动终端用户标识的数量乘以相应边界基站附着所述设定行政区划的移动终端用户的比例,并将所有乘积求和,得到所述设定行政区划在所述设定时间范围内的边界人口数量;
对所述边界人口数量和所有非边界基站的基站标识对应的移动终端用户标识的数量求和,得到所述设定行政区划在所述设定时间范围内的总人口数量。
在一些实施例中,获取信令数据集,包括:通过Kafka消息队列接收并存储实时的信令数据,得到信令数据集。针对所述信令数据集,统计时间戳在设定时间范围内且属于所述设定行政区划的边界基站集的各边界基站的基站标识对应的移动终端用户标识的数量和所有非边界基站的基站标识对应的移动终端用户标识的数量,包括:利用SparkStreaming读取所述Kafka消息队列中设定时间范围内的信令数据,得到所述信令数据集中时间戳在设定时间范围内的所有信令数据;利用mapWithState算子,根据时间戳在设定时间范围内的所述有信令数据与其所对应的基站工参信息中的基站所属行政区划和所对应基站是否为边界基站的信息,统计得到时间戳在设定时间范围内且属于所述设定行政区划的边界基站集的各边界基站的基站标识对应的移动终端用户标识的数量和所有非边界基站的基站标识对应的移动终端用户标识的数量。所述设定时间范围为设定时间周期,所述方法,还包括:若所述设定行政区划在一设定时间周期内的总人口数量相对于在该设定时间周期的前一设定时间周期内的总人口数量的变化量超过设定人口变化阈值,发出人口异常报警信息。
在一些实施例中,获取边界基站集中边界基站的网络覆盖情况测量数据,根据网络覆盖情况测量数据统计边界基站附着其所覆盖的各行政区划的移动终端用户的比例,包括:获取边界基站集中边界基站的网络覆盖情况测量数据;根据网络覆盖情况测量数据中的所有经纬度信息,得到边界基站的实际覆盖范围;将边界基站的实际覆盖范围划按设定大小的地理网格进行划分;根据网络覆盖情况测量数据中的各经纬度位置对应的人口数量计算划分得到的各地理网格内的人口数量;根据各地理网格内的人口数量,统计边界基站所覆盖的各行政区划内的移动终端用户的数量;将边界基站所覆盖的各行政区划内的移动终端用户的数量分别除以边界基站的实际覆盖范围内的移动终端用户的总数量,得到边界基站附着其所覆盖的各行政区划的移动终端用户的比例。
在一些实施例中,所述的人口分析方法,还包括:基于所述信令数据集进行行政区划人口流动和驻留信息分析。其中,基于所述信令数据集进行行政区划人口流动和驻留信息分析,包括:根据所述信令数据集得到其中各移动终端用户标识对应的轨迹序列数据;其中,每条轨迹序列数据包括移动终端用户标识、相应的时间戳序列及相应的基站标识序列;每条轨迹序列数据的时间戳序列的时间范围不小于设定监测天数;根据每个移动终端用户标识对应的轨迹序列数据和相应轨迹序列数据中各基站标识对应的基站所属行政区划,统计每天中相应移动终端用户标识对应的白天驻留时间最长且超过第一设定时长阈值的第一行政区划和夜间驻留时间最长且超过第二时长阈值的第二行政区划;将在设定监测天数内出现次数最多的第一行政区划记录为相应移动终端用户标识对应的工作地,将在设定监测天数内出现次数最多的第二行政区划记录为相应移动终端用户标识对应的居住地,以及将在设定监测天数内出现的除工作地和居住地外的第三行政区划记录为相应移动终端用户标识对应的流动地;针对所述信令数据集中所有移动终端用户标识对应的工作地,统计得到所述信令数据集对应的行政区划群中各行政区划的工作人口数量;基于所述信令数据集中所有移动终端用户标识对应的居住地,统计得到所述信令数据集对应的行政区划群中各行政区划的居住人口数量;基于所述信令数据集中所有移动终端用户标识对应的流动地,统计得到所述信令数据集对应的行政区划群中各行政区划的流动人口数量;通过计算所述行政区划群中每个行政区划的工作人口数量和居住人口数量的和,得到所述行政区划群中相应行政区划的常住人口数量。
在一些实施例中,基于所述信令数据集进行行政区划人口流动和驻留信息分析,还包括:根据所述信令数据集中每个移动终端用户标识对应的流动地,统计得到所述信令数据集对应的行政区划群中各行政区划分别作为流动地时所对应的移动终端用户标识,并获取相应移动终端用户标识对应的基站标识序列中属于相应流动地的基站标识对应的基站位置;根据所述行政区划群中每个行政区划作为流动地时所对应的移动终端用户标识所对应获取的基站位置,从相应行政区划的地图数据中提取相应移动终端用户标识对应的感兴趣地点;对所述行政区划群中每个行政区划作为流动地时所对应的移动终端用户标识所对应提取的感兴趣地点进行分类统计,并根据分类统计结果确定所述行政区划群中每个行政区划的流动驱动类型。
在一些实施例中,基于所述信令数据集进行行政区划人口流动和驻留信息分析,还包括:根据所述信令数据集中各移动终端用户标识对应的轨迹序列数据和相应轨迹序列数据中各基站标识对应的基站所属行政区划,得到相应移动终端用户对应的行政区划序列数据;基于所述信令数据集中各移动终端用户对应的行政区划序列数据,统计得到所述信令数据集对应的行政区划群中不同行政区划之间的移动终端用户标识切换总次数和切换的移动终端用户标识总数,以用于分析不同行政区划之间的人口流动相关性。
在一些实施例中,基于所述信令数据集进行行政区划人口流动和驻留信息分析,还包括:基于所述信令数据集中所有移动终端用户标识对应的工作地和居住地,统计得到所述信令数据集对应的行政区划群中以其中一个行政区划作为居住地且以其余行政区划作为工作地的移动终端用户标识的数量,作为所述行政区划群中相应行政区划在设定监测天数内的人口流出量;通过比较所述行政区划群中每个行政区划在设定监测天数内的人口流出量和常住人口数量,判断相应行政区划是否具有劳动力输出型流动的流动性。基于所述信令数据集进行行政区划人口流动和驻留信息分析,还包括:基于所述信令数据集中所有移动终端用户标识对应的工作地和居住地,统计得到所述信令数据集对应的行政区划群中以其中一个行政区划作为工作地且以其余行政区划作为居住地的移动终端用户标识的数量,作为所述行政区划群中相应行政区划在设定监测天数内的人口流入量;通过比较所述行政区划群中每个行政区划在设定监测天数内的人口流入量和常住人口数量,判断相应行政区划是否具有宜居地流动的流动性。
在一些实施例中,基于所述信令数据集进行行政区划人口流动和驻留信息分析,还包括:根据所述信令数据集中每个移动终端用户标识对应的流动地和相应的轨迹序列数据,统计得到每天中相应移动终端用户标识对应于其各流动地的累计驻留时长;若移动终端用户标识对应于其流动地的累计驻留时长低于设定驻留时间阈值,将相应流动地记录为相应移动用户标识对应的过境地;根据所述信令数据集中各移动终端用户标识对应的过境地,统计得到所述信令数据集对应的行政区划群中每个行政区划作为过境地时所对应的移动终端用户标识总数,作为相应行政区划的过境人口数量。
根据本发明实施例的另一个方面,还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述方法的步骤。
根据本发明实施例的另一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一实施例所述方法的步骤。
本发明实施例的人口分析方法、电子设备及计算机可读存储介质,能够更精确地对行政区划空间单元的人口进行统计分析。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明一实施例的人口分析方法的流程示意图;
图2是本发明一具体实施例的城市群间人口流动和驻留分析方法流程示意图;
图3是本发明一实施例的城市群间人口流动和驻留分析系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
从移动终端设备与基站通信的信令数据中提取用户的出行链,建立基站尺度的实有人口数据,再根据基站与城市空间单元的转换关系,能够得到各个城市空间单元的实有人口数据。但该方法无法解决城市空间单元边界位置基站附着的人群的分类问题,例如,基站A处于两个区县边界,服务范围可跨越这两个区县,此时,基站A上附着的人群无法简单归为基站位置所属区县。
为了解决上述问题,本发明实施例提出了一种人口分析方法,以更精确地对行政区划空间单元的人口进行统计分析。
图1是本发明一实施例的人口分析方法的流程示意图。如图1所示,该些实施例的人口分析方法可包括以下步骤S110~步骤S170。
下面将对步骤S110至步骤S170的具体实施方式进行详细说明。
步骤S110:获取信令数据集;其中,所述信令数据集中的每条信令数据包括移动终端用户标识、基站标识、及时间戳。
该步骤S110中,一条信令数据可以包含一个移动终端用户标识、一个基站标识、及一个时间戳。移动终端用户标识可以是手机号、IMSI(国际移动用户识别码)等,基站标识可以是由运营商ID、基站原始设备制造商ID、LAC(Location Area Code,位置区编码)、CI(小区识别)构成的字符串,时间戳可以是能够反映信令数据产生先后顺序等的信息的各种时间形式。
信令数据集可以是事先得到的数据,例如,当前时间前一个月的数据;或者,信令数据集可以是实时获取的数据,例如,不断获得的增量数据。
具体实施时,可以通过消息队列接收实时的信令数据,累积存储形成信令数据集。示例性地,该步骤S110,即,获取信令数据集,具体可包括步骤:S111,通过Kafka消息队列接收并存储实时的信令数据,得到信令数据集。该步骤S111中,通过Kafka消息队列可以方便地接入分布式集群传来的大量的信令数据。
步骤S120:获取信令数据中的基站标识对应的基站工参信息;其中,所述基站工参信息包括基站位置和基站所属行政区划。
针对信令数据集中每条信令数据,可以通过该步骤S120得到其对应的基站工参信息。基站工参信息可以是在得到信令数据后,根据其中的基站标识实时获取,以此,相对于预先得到所有基站的工参信息而言,具有即使基站工参信息存在更新也可以得到准确地工参信息的优点。
该步骤S120中,可以从基站工参信息配置表中获取基站工参信息,基站工参信息可以包括基站位置和基站所属行政区划,还可以包括基站标识(如基站名称)、基站方位角、基站覆盖半径等。其中,基站所属行政区划具体可包括基站所属城市、区县、街道等各级行政区划信息。所获取的基站工参信息中的基站所属行政区划的级别可以是一个或多个,可以根据需要设定。
步骤S130:获取基站工参信息中基站所属行政区划对应的地图数据,并根据所述地图数据和基站工参信息中的基站位置,计算基站位置与基站所属行政区划的边界的距离。
针对信令数据集中每条信令数据,可以通过该步骤S130得到该条信令数据对应的基站位置与基站所属行政区划的边界的距离。
该步骤S130中,基站所属行政区划对应的地图数据可以是指至少涵盖该基站所属行政区划的地图数据,其中可以包含该基站所属行政区划的边界的位置信息,如边界上各点的经纬度信息,另外,基站位置可以是基站的经纬度信息。此外,基站位置与基站所属行政区划的边界的距离可以是指,基站位置与基站所属行政区划的边界的最近距离。
步骤S140:若基站位置与基站所属行政区划的边界的距离不超过设定距离阈值,则确定相应基站为边界基站,从所有基站所属行政区划的所有边界基站中提取得到设定行政区划的边界基站集。
该步骤S140中,对于每个基站(基站标识),均可以得到其工参信息中记载的基站位置和基站所属行政区划,并计算其基站位置与其基站所属行政区划的边界的距离,然后根据计算得到的距离判断该基站是否属于其基站所属行政区划的边界上的边界基站。
对于一个基站所属行政区划而言,其一般存在相邻的行政区划,若一个基站是该基站所属行政区划的边界基站,那么,若该基站也能够覆盖该基站所属行政区划相邻的行政区划(可以通过选择合适的设定距离阈值,来找到同时覆盖至少覆盖两个相邻的行政区划的边界基站),那么该基站也可以认为是该相邻的行政区划的边界基站,因为该基站也覆盖该相邻的行政区划的至少部分区域。简言之,对于一个行政区划群(如城市群,相邻城市构成的片区)而言,其中,行政区划边界附近(如边界两侧区域)一定范围内的基站(边界基站)可以是该行政区划边界所涉及的行政区划的边界基站。
因此,上述设定行政区划(某一行政区划)的边界基站集中不仅可以包括该设定行政区划内的边界基站,还可包括该设定行政区划边界外附近的边界基站。当然,该设定行政区划的边界基站集中是否包含其边界外的边界基站,还可根据信令数据集所涉及的基站分布有关。
步骤S150:获取边界基站集中边界基站的网络覆盖情况测量数据,根据网络覆盖情况测量数据统计边界基站附着其所覆盖的各行政区划的移动终端用户的比例。
该步骤S150中,基站的网络覆盖情况测量数据可以是该基站的MR数据,可以预先获得,可以包括与该基站通信的用户的经纬度位置信息,可以包括某一经纬度的用户数量。边界基站可以覆盖两个或以上的行政区划区域,通过该步骤S150,可以得知一边界基站覆盖一个行政区划区域的人口数相对于其整个覆盖范围内人口数的占比。
具体实施时,该步骤S150,即,获取边界基站集中边界基站的网络覆盖情况测量数据,根据网络覆盖情况测量数据统计边界基站附着其所覆盖的各行政区划的移动终端用户的比例的方法,具体可包括步骤:S151,获取边界基站集中边界基站的网络覆盖情况测量数据;S152,根据网络覆盖情况测量数据中的所有经纬度信息,得到边界基站的实际覆盖范围;S153,将边界基站的实际覆盖范围划按设定大小的地理网格进行划分;S154,根据网络覆盖情况测量数据中的各经纬度位置对应的人口数量计算划分得到的各地理网格内的人口数量;S155,根据各地理网格内的人口数量,统计边界基站所覆盖的各行政区划内的移动终端用户的数量;S156,将边界基站所覆盖的各行政区划内的移动终端用户的数量分别除以边界基站的实际覆盖范围内的移动终端用户的总数量,得到边界基站附着其所覆盖的各行政区划的移动终端用户的比例。
该步骤S152中,可以根据基站的网络覆盖情况测量数据得知其附着用户的地理位置分布范围,从而可以得知该基站的实际覆盖范围。该步骤S153中,基站的覆盖范围可能是近似于圆形的区域,可以将该区域划分为许多地理网格,例如,长和宽均为一定距离(如150米)的网格。该步骤S154中,网络覆盖情况测量数据中的一个经纬度位置可以对应一定数量的人口(如100人),可以对一个地理网格内各经纬度位置的人口数量求和得到该地理网格中的人口数量。该步骤S155中,对于一个边界基站而言,可以统计其覆盖的一个行政区划区域内的地理网格内的人口数量总和,得到该边界基站实际覆盖该行政区划区域的人口数量。该步骤S156中,该边界基站的实际覆盖范围内的用户总数可以根据其所有地理网格内的人口数量总和得到,进一步可以得到边界基站附着一个行政区划区域的用户的占比。如此一来,可以较为精确地确定一个边界基站对其涉及的各行政区划区域的覆盖情况。
步骤S160:针对所述信令数据集,统计时间戳在设定时间范围内且属于所述设定行政区划的边界基站集的各边界基站的基站标识对应的移动终端用户标识的数量和所有非边界基站的基站标识对应的移动终端用户标识的数量,将所述边界基站集中每个边界基站的基站标识对应的移动终端用户标识的数量乘以相应边界基站附着所述设定行政区划的移动终端用户的比例,并将所有乘积求和,得到所述设定行政区划在所述设定时间范围内的边界人口数量。
步骤S170:对所述边界人口数量和所有非边界基站的基站标识对应的移动终端用户标识的数量求和,得到所述设定行政区划在所述设定时间范围内的总人口数量。
上述步骤S160和步骤S170中,该信令数据集可以是在所要研究的行政区划(如某城市、区县、街道等)或行政区划群(如城市群)的区域内的基站附着的用户的信令数据。所以,利用这样的信令数据集可以统计所要研究的设定行政区划的区域内的边界基站附着人口(用户)数量和非边界基站附着人口(用户)数量,并可据此得到该设定行政区划的总人口数量。
另外,信令数据中包含时间戳和移动终端用户标识,可以通过该时间戳找到设定时间范围内的信令数据,从而找到该设定时间范围内的移动终端用户。其中,该设定时间范围可以根据人口统计的实时性要求来确定,例如,可以是5分钟、一小时、一天、一周、一个月等。
为了获取行政区划空间单元的实时活跃人口数据,考虑每次获取一定时间范围的信令数据,来统计该事件范围内的某一区域的人口。
示例性地,在利用Kafka消息队列接入并存储实时的信令数据的情况下,上述步骤S160中,针对所述信令数据集,统计时间戳在设定时间范围内且属于所述设定行政区划的边界基站集的各边界基站的基站标识对应的移动终端用户标识的数量和所有非边界基站的基站标识对应的移动终端用户标识的数量的方法,具体可包括步骤:S161,利用SparkStreaming读取所述Kafka消息队列中设定时间范围内的信令数据,得到所述信令数据集中时间戳在设定时间范围内的所有信令数据;S162,利用mapWithState算子,根据时间戳在设定时间范围内的所述有信令数据与其所对应的基站工参信息中的基站所属行政区划和所对应基站是否为边界基站的信息,统计得到时间戳在设定时间范围内且属于所述设定行政区划的边界基站集的各边界基站的基站标识对应的移动终端用户标识的数量和所有非边界基站的基站标识对应的移动终端用户标识的数量。
该实施例中,利用Kafka消息队列接收实时的信令数据,利用Spark Streaming读取所述Kafka消息队列中的信令数据,并利用mapWithState算子进行统计,能够方便地统计实时的活跃人口数量。
上述设定时间范围(如上述步骤S161中)可以为设定时间周期,如5分钟。在此情况下,进一步地,图1所示的方法还可包括步骤:S180,若所述设定行政区划在一设定时间周期内的总人口数量相对于在该设定时间周期的前一设定时间周期内的总人口数量的变化量超过设定人口变化阈值,发出人口异常报警信息。
该实施例中,通过该步骤S180可以对某一区域发生异常陡增或陡减的情况下进行人口预警。
上述各实施例的人口分析方法,通过上述步骤S110至步骤S170,基于信令数据和相应的基站工参信息找到行政区划的边界基站集,计算边界基站附着行政区划人口的比例,并基于该比例统计行政区划的人口总数,以此能够解决基站跨区域服务时区域空间单元边界位置的基站附着人群的分类问题,从而能够更精确地对行政区划空间单元的人口进行统计分析。
为了进一步分析行政区划分区域的人口流动和驻留情况,上述各实施例所述的人口分析方法还可包括步骤:S190,基于所述信令数据集进行行政区划人口流动和驻留信息分析。该信令数据集是上述步骤S110中所获取的信令数据集,该信令数据集的范围可以根据需要分析人口流动和驻留信息的行政区划而定。
为了统计分析某一行政区划内的工作人口、居住人口、流动人口、常住人口等,上述步骤S190,即,基于所述信令数据集进行行政区划人口流动和驻留信息分析的分析方法,具体可包括步骤:
S1911,根据所述信令数据集得到其中各移动终端用户标识对应的轨迹序列数据;其中,每条轨迹序列数据包括移动终端用户标识、相应的时间戳序列及相应的基站标识序列;每条轨迹序列数据的时间戳序列的时间范围不小于设定监测天数;
S1912,根据每个移动终端用户标识对应的轨迹序列数据和相应轨迹序列数据中各基站标识对应的基站所属行政区划,统计每天中相应移动终端用户标识对应的白天驻留时间最长且超过第一设定时长阈值的第一行政区划和夜间驻留时间最长且超过第二时长阈值的第二行政区划;
S1913,将在设定监测天数内出现次数最多的第一行政区划记录为相应移动终端用户标识对应的工作地,将在设定监测天数内出现次数最多的第二行政区划记录为相应移动终端用户标识对应的居住地,以及将在设定监测天数内出现的除工作地和居住地外的第三行政区划记录为相应移动终端用户标识对应的流动地;
S1914,针对所述信令数据集中所有移动终端用户标识对应的工作地,统计得到所述信令数据集对应的行政区划群中各行政区划的工作人口数量;基于所述信令数据集中所有移动终端用户标识对应的居住地,统计得到所述信令数据集对应的行政区划群中各行政区划的居住人口数量;基于所述信令数据集中所有移动终端用户标识对应的流动地,统计得到所述信令数据集对应的行政区划群中各行政区划的流动人口数量;通过计算所述行政区划群中每个行政区划的工作人口数量和居住人口数量的和,得到所述行政区划群中相应行政区划的常住人口数量。
上述步骤S1911中,时间戳序列可以是按时间先后排列的时间戳序列,时间戳序列中的每个时间戳可以与基站标识序列中相同次序的基站标识相对应(对应一条信令数据)。具体实施时,轨迹序列数据可以通过对信令轨迹数据集中的信令数据按移动终端用户标识分组,并将每组信令数据按时间戳排序得到,一个移动终端用户标识对应一个时间戳序列,并对应一个基站标识序列。该设定监测天数例如可以为一个月,具体实施时,可以利用消息队列不断接入并存储实时的信令数据,至少累计一个月的信令数据为止。
上述步骤S1912中,对于一个移动终端用户而言,根据其轨迹序列数据中的基站标识序列的基站标识可以获取到基站的工参信息(可包括基站所述行政区划、基站位置等)。例如,执行上述步骤S120之后,所得到的每条信令数据可以包含有相应的基站工参信息(可以是其中的一种或多种,具体视需要而定,如基站所属行政区划),之后,再得到轨迹序列数据时,同时可以得到相应的基站工参信息序列(如基站所属行政区划序列)。对于一个移动终端用户而言,如移动终端用户的时间戳序列时间跨度为设定监测天数,可以从该时间戳序列中找到每天(24小时)中白天时间段(如6:00~20:00)内时间戳对应的基站所属行政区划和夜间时间段(如20:00~6:00)内时间戳对应的基站所属行政区划,可以对白天时段内的基站所属行政区划进行分类统计,结合时间戳数据,可以得到每个基站所属行政区划的累计时长;类似地,可以对夜间时间段内的基站所述行政区划进行分类统计,结合时间戳数据,可以得到每个基站所属行政区划的累计时长。如此一来,对于一个移动终端用户而言,可以得到其每天中白天时段内和夜间时段内各基站所属行政区划的累计时长。可以设置第一设定时长阈值和第二设定时长阈值分别用于筛选白天时段内和夜间时段内累计时长够长的行政区划,其中这两个时长阈值可以相同或不同,例如,可以均为6小时。若累计时长够长的行政区划有多个,可以从中选择累计时长最长的一个。
上述步骤S1913中,对于一个移动终端用户而言,对其设定监测天数内的轨迹序列数据中每天的数据进行筛选,可以得到每天中白天累计时长最长且够长的用户驻留的行政区划和夜间累计时长最长且够长的用户驻留的行政区划。不同天中的白天和夜间的对应筛选出的行政区划可能相同或不同。白天出现次数最多的行政区划很可能是用户的工作地,夜间出现次数最多的行政区划很可能是用户的居住地。对于一个用户而言,除工作地和居住地外,其所驻留的行政区划可以视为其流动地(非常驻地)。另外,流动地可以是多个。如此一来,可以得到各个用户的居住地、工作地及流动地。
上述步骤S1914中,对所有用户按工作地分组,可以得到以各行政区划作为工作地的用户的数量,可以作为工作人口数量。类似的,对所有用户按居住地分组,可以得到以各行政区划作为居住地的用户的数量,可以作为居住人口数量。对所有用户按流动地分组,可以得到以各行政区划作为流动地的用户的数量,可以作为流动人口数量,其中,因为流动地可以有多个,所以一个用户可以同时被计入不同行政区划的流动人口。
该实施例中,由于通过前述步骤S130~S150可以得知信令数据中的基站是否为边界基站,是哪个行政区划的基站,并可以得知为边界基站时覆盖各相关行政区划的比例,所以在上述S1912中统计一个用户在一个行政区划的白天驻留时间和夜间驻留时间时,可以对该行政区划边界内外一定范围内的边界基站附着该用户的时间乘以相应比例(作为权重),非边界基站对应的权重可以设为1,以此得到的白天驻留时间和夜间驻留时间考虑了边界基站跨不同区域的问题。当然,若为了降低数据处理量,该实施例中可以不考虑边界基站覆盖不同区域的问题。
进一步地,可以对行政区划的流动人口的驱动因素进行分析,以得到更深入的人口相关信息。具体实施时,可以分析流动人口在流动地的感兴趣地点来分析流动驱动因素。示例性地,上述步骤S190,即基于所述信令数据集进行行政区划人口流动和驻留信息分析的方法,还可包括步骤:
S1915,根据所述信令数据集中每个移动终端用户标识对应的流动地,统计得到所述信令数据集对应的行政区划群中各行政区划分别作为流动地时所对应的移动终端用户标识,并获取相应移动终端用户标识对应的基站标识序列中属于相应流动地的基站标识对应的基站位置;
S1916,根据所述行政区划群中每个行政区划作为流动地时所对应的移动终端用户标识所对应获取的基站位置,从相应行政区划的地图数据中提取相应移动终端用户标识对应的感兴趣地点;
S1917,对所述行政区划群中每个行政区划作为流动地时所对应的移动终端用户标识所对应提取的感兴趣地点进行分类统计,并根据分类统计结果确定所述行政区划群中每个行政区划的流动驱动类型。
上述步骤S1915中,每个移动终端用户标识对应的流动地可以是上述步骤S1913中得到的相应用户的流动地。可以对用户的流动地进行分组(每组对应一个行政区划的用户),得到各行政区划对应的用户,针对每个行政区划的每个用户,可以获得该用户的基站标识序列中位于该行政区划的基站的位置。上述步骤S1916中,可以根据找到的基站的位置查找附近的用户所感兴趣的地点(可以是地理信息系统中的兴趣点POI),如医院、公交站、高铁站、景点等,可以通过地图爬虫获取基站周围POI兴趣点。上述步骤S1917中,可以对每个行政区划的流动人口的所有感兴趣地点进行分类统计,可以统计用户在感兴趣地点出现的次数和停留时间。例如,若感兴趣地点为公交站、高铁站等,可以划分为商旅类的流动驱动类型,再例如,若感兴趣地点为医院等,可以划分为基础设施类的流动驱动类型,再例如,若感兴趣地点为景点等,可以划分为旅游的流动驱动类型。
为了分析行政区划群(如城市群)中行政区划(如城市)间的人口流动关联情况,上述步骤S190,即,基于所述信令数据集进行行政区划人口流动和驻留信息分析的方法还可包括步骤:S1918,根据所述信令数据集中各移动终端用户标识对应的轨迹序列数据和相应轨迹序列数据中各基站标识对应的基站所属行政区划,得到相应移动终端用户对应的行政区划序列数据;S1919,基于所述信令数据集中各移动终端用户对应的行政区划序列数据,统计得到所述信令数据集对应的行政区划群中不同行政区划之间的移动终端用户标识切换总次数和切换的移动终端用户标识总数,以用于分析不同行政区划之间的人口流动相关性。
上述步骤S1918中,该信令数据集可以是通过前述步骤S110得到的信令数据集。基站所属行政区划可以是通过前述步骤S120得到的基站工参信息中的基站所属行政区划。对信令数据按用户分组,可以得到每个移动终端用户标识对应的轨迹序列数据和相应基站所属行政区划序列。另外,用户的轨迹序列数据可以是前述步骤S1911得到的轨迹序列数据,相应的基站所属行政区划序列可以是前述步骤S1912得到的基站所属行政区划序列。该基站所属行政区划序列数据可以经过了去重处理。
上述步骤S1919中,每个用户的基站所属行政区划序列数据能够反映用户在不同行政区划之间的流转或流动情况,对所有用户的基站所属行政区划序列数据进行行政区划二元组聚类,可以得到各不同两行政区划之间的人口流动情况,据此可以分析不同行政区划(如不同城市)间人口流动的紧密性,例如,若北京和河北之间的人口流动数量较大、人次交过,则可以得知北京和河北之间的人口流动较为紧密。
为了分析某一行政区划分是否属于劳动力输出(由居住地到工作地的流动)驱动的流动,上述步骤S190,即,基于所述信令数据集进行行政区划人口流动和驻留信息分析的方法,还可包括步骤:S1920,基于所述信令数据集中所有移动终端用户标识对应的工作地和居住地,统计得到所述信令数据集对应的行政区划群中以其中一个行政区划作为居住地且以其余行政区划作为工作地的移动终端用户标识的数量,作为所述行政区划群中相应行政区划在设定监测天数内的人口流出量;S1921,通过比较所述行政区划群中每个行政区划在设定监测天数内的人口流出量和常住人口数量,判断相应行政区划是否具有劳动力输出型流动的流动性。
上述步骤S1920中,所述信令数据集中所有移动终端用户标识(用户)可以通过将信令数据集按用户分组得到,每组对应一个用户。每个用户的工作地和居住地可以经由上述步骤S1913等得到。对于一个行政区划群而言,将其中一个行政区划作为居住地,将其他行政区划作为工作地,可以得到由该行政区划到其他行政区划流动的人口情况,从而可以得知该行政区划的劳动力输出量。对于行政区划群中任何一个行政区划可以采用类似的方法得知其劳动力输出量。
上述步骤S1921中,一个行政区划的常住人口数量可以经由上述步骤S1914等得到。对于一个行政区划而言,通过比较人口流出量和常住人口数量,例如计算占比或差值,可以得知该行政区划劳动力输出程度,以此可以根据设定标准判断该行政区划是否具有劳动力输出型流动的特点。
为了分析某一行政区划分是否属于宜居地流动(由工作地到居住地的流动)驱动的流动,上述步骤S190,即,基于所述信令数据集进行行政区划人口流动和驻留信息分析的方法,还可包括步骤:S1922,基于所述信令数据集中所有移动终端用户标识对应的工作地和居住地,统计得到所述信令数据集对应的行政区划群中以其中一个行政区划作为工作地且以其余行政区划作为居住地的移动终端用户标识的数量,作为所述行政区划群中相应行政区划在设定监测天数内的人口流入量;S1923,通过比较所述行政区划群中每个行政区划在设定监测天数内的人口流入量和常住人口数量,判断相应行政区划是否具有宜居地流动的流动性。
上述步骤S1922中,所述信令数据集中所有移动终端用户标识(用户)可以通过将信令数据集按用户分组得到,每组对应一个用户。每个用户的工作地和居住地可以经由上述步骤S1913等得到。对于一个行政区划群而言,将其中一个行政区划作为工作地,将其他行政区划作为居住地,可以得到其他行政区划向该行政区划流入的人口情况,从而可以得知该行政区划的人口流入量。对于行政区划群中任何一个行政区划可以采用类似的方法得知其人口流入量。
上述步骤S1923中,一个行政区划的常住人口数量可以经由上述步骤S1914等得到。对于一个行政区划而言,通过比较人口流入量和常住人口数量,例如计算占比或差值,可以得知该行政区划人口流入程度,以此可以根据设定标准判断该行政区划是否具有宜居流动的特点。
为了统计分析某一行政区划的过境人口,上述步骤S190,即,基于所述信令数据集进行行政区划人口流动和驻留信息分析的方法,还可包括步骤:S1924,根据所述信令数据集中每个移动终端用户标识对应的流动地和相应的轨迹序列数据,统计得到每天中相应移动终端用户标识对应于其各流动地的累计驻留时长;S1925,若移动终端用户标识对应于其流动地的累计驻留时长低于设定驻留时间阈值,将相应流动地记录为相应移动用户标识对应的过境地;S1926,根据所述信令数据集中各移动终端用户标识对应的过境地,统计得到所述信令数据集对应的行政区划群中每个行政区划作为过境地时所对应的移动终端用户标识总数,作为相应行政区划的过境人口数量。
上述步骤S1924中,各用户的流动地可以经由上述步骤S1913等得到,轨迹序列数据可以经由S1911得到。每天用户可能在一个或多个行政区划驻留过且为该区域流动人口,则可针对该用户经过的各行政区划分统计其当天在同一个行政区划驻留的总时间。上述步骤S1925中,该设定驻留时间阈值例如可以为一小时,若用户在一个行政区划驻留时间很短,则该用户很可能只是经过该区域,则可认为是该区域的过境人口,即该区域为该用户的过境地。上述步骤S1926中,可以针对每个行政区划统计其过境人口数量,以此可以对该行政区划进行过境型流动性分析判断。
上述不同的实施例中,可以分别得到工作人口数量、居住人口数量、流动人口数量、常住人口数量、依据感兴趣地点得到的流动驱动类型、不同行政区划之间的人口流动人次人数、劳动力输出型流动情况、宜居地流动情况、过境人口数量等,可以将这些信息中的一个种或多种结合总人口数量对行政区划分的人口流动情况进行分析,从而得到更精确的人口分析结果,进而更好地指导区域发展决策。
另外,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一实施例所述方法的步骤。
为使本领域技术人员更好地了解本发明,下面将以具体实施例说明本发明的实施方式。
在一具体实施例中,以城市为行政区划,以城市群为行政区划群,对本发明实施例的人口分析方法进行具体说明,以从海量信令数据中分析一个城市群内人口在不同城市之间的流动和驻留情况。该实施例中,基于大量信令数据,利用大数据实时计算引擎Spark的mapWithState算法实时获取各城市及城市内空间单元的实时活跃人口统计数据,基于分钟级单位展现城市群间人口热力变化,并可进行人口变化异常实时预警。提取城市边界及城市内空间单元边界位置基站,分析其方位角和覆盖半径等参数,将边界基站吸附的人群数量合理地分配到各空间单元,以提高人口统计准确性。
图2是本发明一具体实施例的城市群间人口流动和驻留分析方法流程示意图,参见图2,该具体实施例的分析方法可包括以下步骤:
S1,通过Kafka消息队列接入实时信令数据,并对实时信令数据进行存储,得到信令数据集,每条信令数据可包括用户标识、基站标识、时间戳;
S2,获取基站工参信息配置表:根据步骤S1中信令数据中的基站标识获取基站工参信息,可包括基站名称、基站位置、方位角、覆盖半径、基站所属行政区划(如城市、区县、街道)等信息;
S3,获取边界基站:根据步骤S2中的基站位置和城市行政区划地图数据,计算距离行政区划边界不超过例如100米的基站集合即为边界基站集,具体可分为城市边界基站集合、区县边界基站集合、街道边界基站集合;
S4,获取实时活跃人口:利用Spark Streaming读取步骤S1中的Kafka消息队列中例如5分钟的实时信令数据,利用mapWithState算子,计算该区域实时人口数量(具体地,可以以城市编码(或更细粒度的区县编码、街道编码等)为Key,计算当前5分钟该区域的人口数量,并保存为状态值),并对人口异常徒增或陡降进行实时异常预警;
S5,边界基站人口分类:对于步骤S3中得到的边界基站,获取其MR数据(测量数据),统计分析边界基站实际覆盖范围和人口在其覆盖范围内各个例如150米长宽的地理网格内的人口分布情况,从而可以根据比例计算边界基站附着人口属于不同区域的比例;
S6,提取用户轨迹:对步骤S1中的得到的信令数据集中每天全量信令数据按照用户ID进行分组计算,基于基站位置变化对每个用户提取轨迹序列;
S7,计算人口驻留,获取疑似工作地和居住地:根据步骤S6中的用户轨迹序列和步骤S2中得到的每个基站所属的行政区划,分别计算用户在每天夜间、白天驻留时间最长且超过设定阈值(例如取6小时)的城市、区县、街道,作为疑似居住地和工作地候选区域;
S8,获取高可信工作地和居住地:连续监测一个月的用户轨迹数据,获得用户一个月内疑似居住地和工作地(如通过步骤S7得到)频率分布,出现频率最高且大于设定阈值(例如取15天)的疑似居住地和工作地即为高可信居住地和工作地;
S9,根据用户的居住地和工作地,获取不同城市的常住人口(工作人口和居住人口的合集)、工作人口和居住人口;
S10,获取流动人口:在某城市出现但不属于该城市常住人口的用户属于该城市的流动人口;
S11,获取过境人口:流动人口中在某城市出现,但日累计驻留时间低于设定阈值(例如取1小时)的用户认为是过境人口;
S12,流动人口分类:对步骤S10得到的流动人口的轨迹序列(由步骤S6得到)进行分析,对其轨迹点(基站)通过地图爬虫获取其周边POI(Point Of Interest,兴趣点,地理信息系统中的兴趣点可以是公交站、医院、高铁站等地点)数据,根据各个轨迹点的POI类别和流动人口在不同类别POI点的出现次数即停留时间对流动人口进行分类,包括:旅游人口、就医人口、商旅人口、探亲人口等;
S13,提取用户流动数据:基于步骤S6得到的用户轨迹序列,计算用户在不同城市之间的流动数据序列;其中,若用户连续轨迹点出现在不同的城市,可视为一次城市间的人口流动;
S14,获取城市群间流动性:根据步骤S13得到的用户的流动数据序列,对不同城市二元组进行聚类,得到不同城市之间人口流动的人次、人数;类似地,可以得到不同区县或街道之间的人口流动人次、人数数据;
S15,城市群间流动性分析:可结合城市群内各城市常住人口、流动人口、过境人口及城市群间人口流动性,对不同城市间的流动性进行分类;例如,可以将流动性分为:劳动力输出型流动(居住城市到工作城市的流动)、宜居地流动(工作城市到居住城市的流动)、旅游驱动型流动(旅游人口的流动)、基础设施驱动型流动(就医人口流动)等。
图3是本发明一实施例的城市群间人口流动和驻留分析系统的结构示意图,参见图3,该系统可包括以下模块:
信令数据接入模块,用于:通过Kafka消息队列等方式接入实时信令数据,并对实时信令数据进行存储;
轨迹提取模块,用于:对每天的全量信令数据按照用户ID进行分组计算,并对每个用户提取轨迹序列;
人口驻留计算模块,用于:计算区域实时活跃人口,对边界基站附着人口进行分类,并根据用户轨迹,计算用户在不同城市、区县、街道的停留时间,从而获取城市群间不同城市、区县、街道的常住人口、工作人口、居住人口、流动人口和过境人口信息;结合地图POI爬虫数据,对流动人口进一步分析,可以得到就医人口、旅游人口、探亲人口等;
城市间人口流动性计算模块,用于:根据用户在不同城市间的轨迹切换数据计算得到城市群间的人口流动人次和频次,结合流动人口的工作地、居住地、出行数据分析,可以识别不同城市间的人口流动的背后原由:旅游驱动、工作驱动、基础设施驱动等。
上述实施例的分析方法和系统具有的有益效果包括:(1)基于实时信令大数据,分析城市群间的人口驻留和流动现象,识别城市实时活跃人口、常住人口、居住人口、工作人口、流动人口和过境人口,相较传统人口统计方式及基于视频、wifi等相对抽样的人口统计方法,本方案的人口覆盖范围更全更大,实时活跃人口统计时效性高,基于基站覆盖范围的区域人口分类使得人口统计准确性更高;(2)对流动人口的详细分析可以区分就医、旅游、探亲、商旅等到访意图,可对城市规划、社会治安管理提供指导意见;(3)对城市间人口流动人次、人数、驱动因素的分析,可以直观展现城市群间协同发展程度、偏离度,为政策制定提供决策支持。
综上所述,本发明实施例的人口分析方法、电子设备及计算机可读存储介质,基于信令数据和相应的基站工参信息找到行政区划的边界基站集,计算边界基站附着行政区划人口的比例,并基于该比例统计行政区划的人口总数,以此能够解决基站跨区域服务时区域空间单元边界位置的基站附着人群的分类问题,从而能够更精确地对行政区划空间单元的人口进行统计分析。进一步,可以分析得到工作人口数量、居住人口数量、流动人口数量、常住人口数量、依据感兴趣地点得到的流动驱动类型、不同行政区划之间的人口流动人次人数、劳动力输出型流动情况、宜居地流动情况、过境人口数量等信息,将这些信息中的一个种或多种结合总人口数量对行政区划分的人口流动情况进行分析,可以得到更精确的人口分析结果,进而更好地指导区域发展决策。
在本说明书的描述中,参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本发明的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种人口分析方法,其特征在于,包括:
获取信令数据集;其中,所述信令数据集中的每条信令数据包括移动终端用户标识、基站标识、及时间戳;
获取信令数据中的基站标识对应的基站工参信息;其中,所述基站工参信息包括基站位置和基站所属行政区划;
获取基站工参信息中基站所属行政区划对应的地图数据,并根据所述地图数据和基站工参信息中的基站位置,计算基站位置与基站所属行政区划的边界的距离;
若基站位置与基站所属行政区划的边界的距离不超过设定距离阈值,则确定相应基站为边界基站,从所有基站所属行政区划的所有边界基站中提取得到设定行政区划的边界基站集;
获取边界基站集中边界基站的网络覆盖情况测量数据,根据网络覆盖情况测量数据统计边界基站附着其所覆盖的各行政区划的移动终端用户的比例;
针对所述信令数据集,统计时间戳在设定时间范围内且属于所述设定行政区划的边界基站集的各边界基站的基站标识对应的移动终端用户标识的数量和所有非边界基站的基站标识对应的移动终端用户标识的数量,将所述边界基站集中每个边界基站的基站标识对应的移动终端用户标识的数量乘以相应边界基站附着所述设定行政区划的移动终端用户的比例,并将所有乘积求和,得到所述设定行政区划在所述设定时间范围内的边界人口数量;
对所述边界人口数量和所有非边界基站的基站标识对应的移动终端用户标识的数量求和,得到所述设定行政区划在所述设定时间范围内的总人口数量。
2.如权利要求1所述的人口分析方法,其特征在于,
获取信令数据集,包括:
通过Kafka消息队列接收并存储实时的信令数据,得到信令数据集;
针对所述信令数据集,统计时间戳在设定时间范围内且属于所述设定行政区划的边界基站集的各边界基站的基站标识对应的移动终端用户标识的数量和所有非边界基站的基站标识对应的移动终端用户标识的数量,包括:
利用Spark Streaming读取所述Kafka消息队列中设定时间范围内的信令数据,得到所述信令数据集中时间戳在设定时间范围内的所有信令数据;
利用mapWithState算子,根据时间戳在设定时间范围内的所述有信令数据与其所对应的基站工参信息中的基站所属行政区划和所对应基站是否为边界基站的信息,统计得到时间戳在设定时间范围内且属于所述设定行政区划的边界基站集的各边界基站的基站标识对应的移动终端用户标识的数量和所有非边界基站的基站标识对应的移动终端用户标识的数量;
所述设定时间范围为设定时间周期,所述方法,还包括:
若所述设定行政区划在一设定时间周期内的总人口数量相对于在该设定时间周期的前一设定时间周期内的总人口数量的变化量超过设定人口变化阈值,发出人口异常报警信息。
3.如权利要求1所述的人口分析方法,其特征在于,获取边界基站集中边界基站的网络覆盖情况测量数据,根据网络覆盖情况测量数据统计边界基站附着其所覆盖的各行政区划的移动终端用户的比例,包括:
获取边界基站集中边界基站的网络覆盖情况测量数据;
根据网络覆盖情况测量数据中的所有经纬度信息,得到边界基站的实际覆盖范围;
将边界基站的实际覆盖范围划按设定大小的地理网格进行划分;
根据网络覆盖情况测量数据中的各经纬度位置对应的人口数量计算划分得到的各地理网格内的人口数量;
根据各地理网格内的人口数量,统计边界基站所覆盖的各行政区划内的移动终端用户的数量;
将边界基站所覆盖的各行政区划内的移动终端用户的数量分别除以边界基站的实际覆盖范围内的移动终端用户的总数量,得到边界基站附着其所覆盖的各行政区划的移动终端用户的比例。
4.如权利要求1至3任一项所述的人口分析方法,其特征在于,还包括:基于所述信令数据集进行行政区划人口流动和驻留信息分析;
其中,基于所述信令数据集进行行政区划人口流动和驻留信息分析,包括:
根据所述信令数据集得到其中各移动终端用户标识对应的轨迹序列数据;其中,每条轨迹序列数据包括移动终端用户标识、相应的时间戳序列及相应的基站标识序列;每条轨迹序列数据的时间戳序列的时间范围不小于设定监测天数;
根据每个移动终端用户标识对应的轨迹序列数据和相应轨迹序列数据中各基站标识对应的基站所属行政区划,统计每天中相应移动终端用户标识对应的白天驻留时间最长且超过第一设定时长阈值的第一行政区划和夜间驻留时间最长且超过第二时长阈值的第二行政区划;
将在设定监测天数内出现次数最多的第一行政区划记录为相应移动终端用户标识对应的工作地,将在设定监测天数内出现次数最多的第二行政区划记录为相应移动终端用户标识对应的居住地,以及将在设定监测天数内出现的除工作地和居住地外的第三行政区划记录为相应移动终端用户标识对应的流动地;
针对所述信令数据集中所有移动终端用户标识对应的工作地,统计得到所述信令数据集对应的行政区划群中各行政区划的工作人口数量;基于所述信令数据集中所有移动终端用户标识对应的居住地,统计得到所述信令数据集对应的行政区划群中各行政区划的居住人口数量;基于所述信令数据集中所有移动终端用户标识对应的流动地,统计得到所述信令数据集对应的行政区划群中各行政区划的流动人口数量;通过计算所述行政区划群中每个行政区划的工作人口数量和居住人口数量的和,得到所述行政区划群中相应行政区划的常住人口数量。
5.如权利要求4所述的人口分析方法,其特征在于,基于所述信令数据集进行行政区划人口流动和驻留信息分析,还包括:
根据所述信令数据集中每个移动终端用户标识对应的流动地,统计得到所述信令数据集对应的行政区划群中各行政区划分别作为流动地时所对应的移动终端用户标识,并获取相应移动终端用户标识对应的基站标识序列中属于相应流动地的基站标识对应的基站位置;
根据所述行政区划群中每个行政区划作为流动地时所对应的移动终端用户标识所对应获取的基站位置,从相应行政区划的地图数据中提取相应移动终端用户标识对应的感兴趣地点;
对所述行政区划群中每个行政区划作为流动地时所对应的移动终端用户标识所对应提取的感兴趣地点进行分类统计,并根据分类统计结果确定所述行政区划群中每个行政区划的流动驱动类型。
6.如权利要求4所述的人口分析方法,其特征在于,基于所述信令数据集进行行政区划人口流动和驻留信息分析,还包括:
根据所述信令数据集中各移动终端用户标识对应的轨迹序列数据和相应轨迹序列数据中各基站标识对应的基站所属行政区划,得到相应移动终端用户对应的行政区划序列数据;
基于所述信令数据集中各移动终端用户对应的行政区划序列数据,统计得到所述信令数据集对应的行政区划群中不同行政区划之间的移动终端用户标识切换总次数和切换的移动终端用户标识总数,以用于分析不同行政区划之间的人口流动相关性。
7.如权利要求4所述的人口分析方法,其特征在于,
基于所述信令数据集进行行政区划人口流动和驻留信息分析,还包括:
基于所述信令数据集中所有移动终端用户标识对应的工作地和居住地,统计得到所述信令数据集对应的行政区划群中以其中一个行政区划作为居住地且以其余行政区划作为工作地的移动终端用户标识的数量,作为所述行政区划群中相应行政区划在设定监测天数内的人口流出量;
通过比较所述行政区划群中每个行政区划在设定监测天数内的人口流出量和常住人口数量,判断相应行政区划是否具有劳动力输出型流动的流动性;
基于所述信令数据集进行行政区划人口流动和驻留信息分析,还包括:
基于所述信令数据集中所有移动终端用户标识对应的工作地和居住地,统计得到所述信令数据集对应的行政区划群中以其中一个行政区划作为工作地且以其余行政区划作为居住地的移动终端用户标识的数量,作为所述行政区划群中相应行政区划在设定监测天数内的人口流入量;
通过比较所述行政区划群中每个行政区划在设定监测天数内的人口流入量和常住人口数量,判断相应行政区划是否具有宜居地流动的流动性。
8.如权利要求4所述的人口分析方法,其特征在于,基于所述信令数据集进行行政区划人口流动和驻留信息分析,还包括:
根据所述信令数据集中每个移动终端用户标识对应的流动地和相应的轨迹序列数据,统计得到每天中相应移动终端用户标识对应于其各流动地的累计驻留时长;
若移动终端用户标识对应于其流动地的累计驻留时长低于设定驻留时间阈值,将相应流动地记录为相应移动用户标识对应的过境地;
根据所述信令数据集中各移动终端用户标识对应的过境地,统计得到所述信令数据集对应的行政区划群中每个行政区划作为过境地时所对应的移动终端用户标识总数,作为相应行政区划的过境人口数量。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010450781.XA CN111615054B (zh) | 2020-05-25 | 2020-05-25 | 人口分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010450781.XA CN111615054B (zh) | 2020-05-25 | 2020-05-25 | 人口分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111615054A true CN111615054A (zh) | 2020-09-01 |
CN111615054B CN111615054B (zh) | 2021-04-13 |
Family
ID=72205674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010450781.XA Active CN111615054B (zh) | 2020-05-25 | 2020-05-25 | 人口分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111615054B (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052280A (zh) * | 2020-09-10 | 2020-12-08 | 厦门市美亚柏科信息股份有限公司 | 一种基于时空数据的实有人口分析方法及系统 |
CN112184735A (zh) * | 2020-10-09 | 2021-01-05 | 上海晶确科技有限公司 | 地理信息架构及内容形成的方法 |
CN112288131A (zh) * | 2020-09-24 | 2021-01-29 | 和智信(山东)大数据科技有限公司 | 公交站点优化方法、电子设备及计算机可读存储介质 |
CN112487256A (zh) * | 2020-12-10 | 2021-03-12 | 中国移动通信集团江苏有限公司 | 对象查询方法、装置、设备及存储介质 |
CN112712112A (zh) * | 2020-12-28 | 2021-04-27 | 中国移动通信集团江苏有限公司 | 区域流动人口识别方法、装置、设备及介质 |
CN113723654A (zh) * | 2020-12-31 | 2021-11-30 | 京东城市(北京)数字科技有限公司 | 基于多源数据的救灾物资需求评估方法、装置及计算机设备 |
CN114363823A (zh) * | 2021-05-26 | 2022-04-15 | 科大国创云网科技有限公司 | 基于mr常驻地和建筑物轮廓的人口密度监测方法及系统 |
CN114741612A (zh) * | 2022-06-13 | 2022-07-12 | 北京融信数联科技有限公司 | 一种基于大数据的消费习惯分类方法、系统和存储介质 |
CN115119253A (zh) * | 2022-08-30 | 2022-09-27 | 北京东方国信科技股份有限公司 | 区域人流量监测及确定监测参数的方法、装置及设备 |
CN115409434A (zh) * | 2022-11-02 | 2022-11-29 | 北京融信数联科技有限公司 | 基于信令大数据的区域人口统计方法、系统及存储介质 |
CN116861197A (zh) * | 2023-09-01 | 2023-10-10 | 北京融信数联科技有限公司 | 一种基于大数据的流动人口监测方法、系统和存储介质 |
CN116992267A (zh) * | 2023-09-28 | 2023-11-03 | 北京融信数联科技有限公司 | 一种基于信令数据的区域人口性别识别方法及系统 |
JP7385726B1 (ja) * | 2022-12-13 | 2023-11-22 | Kddi株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN117177177A (zh) * | 2023-11-03 | 2023-12-05 | 北京融信数联科技有限公司 | 一种基于信令数据的小区域职住人口统计方法及系统 |
CN117271620A (zh) * | 2023-11-17 | 2023-12-22 | 深圳深略智慧信息服务有限公司 | 一种基于大数据的人口普查系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2418617A1 (en) * | 2009-04-06 | 2012-02-15 | NTT DoCoMo, Inc. | Communication system, information analyzing apparatus and information analyzing method |
CN109362041A (zh) * | 2018-12-18 | 2019-02-19 | 成都方未科技有限公司 | 一种基于大数据的人口时空分布分析方法 |
CN109918459A (zh) * | 2019-01-28 | 2019-06-21 | 同济大学 | 一种基于手机信令的城市中观层面实有人口统计方法 |
CN110868689A (zh) * | 2019-11-25 | 2020-03-06 | 智慧足迹数据科技有限公司 | 常住人口确定方法、装置和电子设备 |
CN110930285A (zh) * | 2020-02-05 | 2020-03-27 | 北京交研智慧科技有限公司 | 一种人口分布分析方法及装置 |
-
2020
- 2020-05-25 CN CN202010450781.XA patent/CN111615054B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2418617A1 (en) * | 2009-04-06 | 2012-02-15 | NTT DoCoMo, Inc. | Communication system, information analyzing apparatus and information analyzing method |
CN109362041A (zh) * | 2018-12-18 | 2019-02-19 | 成都方未科技有限公司 | 一种基于大数据的人口时空分布分析方法 |
CN109918459A (zh) * | 2019-01-28 | 2019-06-21 | 同济大学 | 一种基于手机信令的城市中观层面实有人口统计方法 |
CN110868689A (zh) * | 2019-11-25 | 2020-03-06 | 智慧足迹数据科技有限公司 | 常住人口确定方法、装置和电子设备 |
CN110930285A (zh) * | 2020-02-05 | 2020-03-27 | 北京交研智慧科技有限公司 | 一种人口分布分析方法及装置 |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052280B (zh) * | 2020-09-10 | 2022-04-29 | 厦门市美亚柏科信息股份有限公司 | 一种基于时空数据的实有人口分析方法及系统 |
CN112052280A (zh) * | 2020-09-10 | 2020-12-08 | 厦门市美亚柏科信息股份有限公司 | 一种基于时空数据的实有人口分析方法及系统 |
CN112288131A (zh) * | 2020-09-24 | 2021-01-29 | 和智信(山东)大数据科技有限公司 | 公交站点优化方法、电子设备及计算机可读存储介质 |
CN112288131B (zh) * | 2020-09-24 | 2021-06-11 | 和智信(山东)大数据科技有限公司 | 公交站点优化方法、电子设备及计算机可读存储介质 |
CN112184735A (zh) * | 2020-10-09 | 2021-01-05 | 上海晶确科技有限公司 | 地理信息架构及内容形成的方法 |
CN112487256A (zh) * | 2020-12-10 | 2021-03-12 | 中国移动通信集团江苏有限公司 | 对象查询方法、装置、设备及存储介质 |
CN112712112A (zh) * | 2020-12-28 | 2021-04-27 | 中国移动通信集团江苏有限公司 | 区域流动人口识别方法、装置、设备及介质 |
CN113723654A (zh) * | 2020-12-31 | 2021-11-30 | 京东城市(北京)数字科技有限公司 | 基于多源数据的救灾物资需求评估方法、装置及计算机设备 |
CN114363823B (zh) * | 2021-05-26 | 2023-09-19 | 科大国创云网科技有限公司 | 基于mr常驻地和建筑物轮廓的人口密度监测方法及系统 |
CN114363823A (zh) * | 2021-05-26 | 2022-04-15 | 科大国创云网科技有限公司 | 基于mr常驻地和建筑物轮廓的人口密度监测方法及系统 |
CN114741612A (zh) * | 2022-06-13 | 2022-07-12 | 北京融信数联科技有限公司 | 一种基于大数据的消费习惯分类方法、系统和存储介质 |
CN115119253A (zh) * | 2022-08-30 | 2022-09-27 | 北京东方国信科技股份有限公司 | 区域人流量监测及确定监测参数的方法、装置及设备 |
CN115119253B (zh) * | 2022-08-30 | 2022-11-18 | 北京东方国信科技股份有限公司 | 区域人流量监测及确定监测参数的方法、装置及设备 |
CN115409434A (zh) * | 2022-11-02 | 2022-11-29 | 北京融信数联科技有限公司 | 基于信令大数据的区域人口统计方法、系统及存储介质 |
CN115409434B (zh) * | 2022-11-02 | 2023-03-24 | 北京融信数联科技有限公司 | 基于信令大数据的区域人口统计方法、系统及存储介质 |
JP7385726B1 (ja) * | 2022-12-13 | 2023-11-22 | Kddi株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN116861197A (zh) * | 2023-09-01 | 2023-10-10 | 北京融信数联科技有限公司 | 一种基于大数据的流动人口监测方法、系统和存储介质 |
CN116861197B (zh) * | 2023-09-01 | 2024-04-05 | 北京融信数联科技有限公司 | 一种基于大数据的流动人口监测方法、系统和存储介质 |
CN116992267A (zh) * | 2023-09-28 | 2023-11-03 | 北京融信数联科技有限公司 | 一种基于信令数据的区域人口性别识别方法及系统 |
CN116992267B (zh) * | 2023-09-28 | 2024-01-23 | 北京融信数联科技有限公司 | 一种基于信令数据的区域人口性别识别方法及系统 |
CN117177177A (zh) * | 2023-11-03 | 2023-12-05 | 北京融信数联科技有限公司 | 一种基于信令数据的小区域职住人口统计方法及系统 |
CN117177177B (zh) * | 2023-11-03 | 2024-02-27 | 北京融信数联科技有限公司 | 一种基于信令数据的小区域职住人口统计方法及系统 |
CN117271620A (zh) * | 2023-11-17 | 2023-12-22 | 深圳深略智慧信息服务有限公司 | 一种基于大数据的人口普查系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111615054B (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111615054B (zh) | 人口分析方法及装置 | |
Caceres et al. | Deriving origin–destination data from a mobile phone network | |
CN109996186B (zh) | 一种网络覆盖问题识别方法及装置、可读取存储介质 | |
Wang et al. | Estimating dynamic origin-destination data and travel demand using cell phone network data | |
Wei et al. | Multiscale identification of urban functional polycentricity for planning implications: An integrated approach using geo-big transport data and complex network modeling | |
US10467199B2 (en) | Definition method for urban dynamic spatial structure circle | |
Cui et al. | Identifying mismatch between urban travel demand and transport network services using GPS data: A case study in the fast growing Chinese city of Harbin | |
Fekih et al. | A data-driven approach for origin–destination matrix construction from cellular network signalling data: a case study of Lyon region (France) | |
Ricciato et al. | Beyond the “single-operator, CDR-only” paradigm: An interoperable framework for mobile phone network data analyses and population density estimation | |
EP2608181B1 (en) | Method for detecting traffic | |
Qin et al. | EXIMIUS: A measurement framework for explicit and implicit urban traffic sensing | |
CN112418556B (zh) | 一种基于互联网共享平台下的网格化服务系统 | |
Xu et al. | Understanding vehicular routing behavior with location-based service data | |
Xue et al. | Multi-source data-driven identification of urban functional areas: A case of Shenyang, China | |
Yang et al. | Detecting home and work locations from mobile phone cellular signaling data | |
Imai et al. | Origin-destination trips generated from operational data of a mobile network for urban transportation planning | |
Duan et al. | MobilePulse: Dynamic profiling of land use pattern and OD matrix estimation from 10 million individual cell phone records in Shanghai | |
CN111417075B (zh) | 一种基于移动通信大数据的用户工作地识别方法 | |
Lwin et al. | Identification of various transport modes and rail transit behaviors from mobile CDR data: A case of Yangon City | |
Turner et al. | Exploring Crowdsourced Monitoring Data for Safety | |
Ayesha et al. | User localization based on call detail record | |
CN114666738A (zh) | 基于手机信令的国土空间规划方法和系统 | |
Chen et al. | Analysis of travel demand between transportation hubs in urban agglomeration based on mobile phone call detail record data | |
Salanova et al. | Use of probe data generated by taxis | |
Yang et al. | Travel Behavior Characteristics Analysis Technology Based on Mobile Phone Location Data: Methodology and Empirical Research |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |