CN111866776A - 一种基于手机信令数据的人口测算方法及装置 - Google Patents
一种基于手机信令数据的人口测算方法及装置 Download PDFInfo
- Publication number
- CN111866776A CN111866776A CN202010779861.XA CN202010779861A CN111866776A CN 111866776 A CN111866776 A CN 111866776A CN 202010779861 A CN202010779861 A CN 202010779861A CN 111866776 A CN111866776 A CN 111866776A
- Authority
- CN
- China
- Prior art keywords
- population
- mobile phone
- group
- sample expansion
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011664 signaling Effects 0.000 title claims abstract description 86
- 238000004364 calculation method Methods 0.000 title claims abstract description 29
- 238000000691 measurement method Methods 0.000 title claims abstract description 7
- 238000005259 measurement Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000000034 method Methods 0.000 claims description 57
- 238000012360 testing method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于手机信令数据的人口测算方法及装置,涉及数据处理技术领域,主要目的在于提高基于手机信令数据的人口测算准确度;主要技术方案包括:根据目标区域中手机用户的手机信令数据,将所述目标区域内的手机用户交叉划分为至少两个人口组,并确定每个所述人口组的手机用户总量;基于各所述人口组的官方统计数据和手机用户总量,确定各人口组的扩样系数;基于所述扩样系数,对所述目标区域进行人口测算。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种基于手机信令数据的人口测算方法及装置。
背景技术
随着信息技术的发展,手机信令数据得到了越来越广泛的使用。手机信令数据具有较高的空间精度、丰富的时空信息、较全面的样本覆盖,可以反映不同用户的行为,从而实现识别不同人口测算,为科学城市规划决策提供依据。
我国有移动、联通、电信等多家运营商,且手机信令数据不能完整覆盖儿童、老人等不持有手机群体,所以手机用户的手机信令数据虽然样本量大,但仍旧不是全样本,需要进行扩样技术的研究,才能使基于手机信令数据的人口测算,为科学的城市与交通规划决策提供依据。
目前在人口测算在进行扩样时,通常都是过于依赖某一个总量值来确定扩样系数,比如,若采用市场占有率来确定扩样系数,则该扩样系数的确定将完全依靠不同运营商市场占有率,而该不同运营商市场占有率的准确度往往难以保证,从而导致人口测算的结果准确度较低。
发明内容
有鉴于此,本发明提出了一种基于手机信令数据的人口测算方法及装置,主要目的在于提高基于手机信令数据的人口测算准确度。
第一方面,本发明提供了一种手机信令数据的人口测算方法,该方法包括:
根据目标区域中手机用户的手机信令数据,将所述目标区域内的手机用户交叉划分为至少两个人口组,并确定每个所述人口组的手机用户总量;
基于各所述人口组的官方统计数据和手机用户总量,确定各人口组的扩样系数;
基于所述扩样系数,对所述目标区域进行人口测算。
第二方面,本发明提供了一种手机信令数据的人口测算装置,该装置包括:
划分单元,用于根据目标区域中手机用户的手机信令数据,将所述目标区域内的手机用户交叉划分为至少两个人口组,并确定每个所述人口组的手机用户总量;
确定单元,用于基于各所述人口组的官方统计数据和手机用户总量,确定各人口组的扩样系数;
测算单元,用于基于所述扩样系数,对所述目标区域进行人口测算。
第三方面,本发明提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行第一方面所述的基于手机信令数据的人口测算方法。
第四方面,本发明提供了一种存储管理设备,所述存储管理设备包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于运行所述程序以执行第一方面所述的基于手机信令数据的人口测算方法。
借由上述技术方案,本发明提供的基于手机信令数据的人口测算方法及装置,能够根据目标区域中手机用户的手机信令数据,将目标区域内的手机用户交叉划分为至少两个人口组,并确定每个人口组的手机用户总量。然后基于各人口组的官方统计人口总量、官方统计公共交通客流量、官方统计运营商市场占有率等官方统计数据和手机用户总量确定各人口组的扩样系数,并基于所确定的扩样系数,对目标区域进行人口测算。可见,本发明在确定扩样系数时不仅考虑了目标区域中不同人口结构和特征,而且综合使用了官方统计人口总量、官方运营商市场占有率和官方公共交通客流量等官方统计数据,因此本发明能够提高扩样系数的准确度,从而提高基于手机信令数据的人口测算准确度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明一个实施例提供的一种基于手机信令数据的人口测算方法的流程图;
图2示出了本发明另一个实施例提供的一种基于手机信令数据的人口测算方法的流程图;
图3示出了本发明一个实施例提供的一种柱状图;
图4示出了本发明一个实施例提供的一种基于手机信令数据的人口测算装置的结构示意图;
图5示出了本发明另一个实施例提供的一种基于手机信令数据的人口测算装置的结构示意图。
具体实施方式
下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本发明实施例提供了一种基于手机信令数据的人口测算方法,该方法主要包括:
101、根据目标区域中手机用户的手机信令数据,将所述目标区域内的手机用户交叉划分为至少两个人口组,并确定每个所述人口组的手机用户总量。
在实际应用中,目标区域可以是采用预设的区域划分方式从一个大的区域中划分出的。该区域划分方式可以为依据行政区域划分方式,也可以为依据特定道路划分方式,本实施例不做具体限定。可选地,大区域为北京,则若依据行政区域划分方式进行划分,则目标区域可以为西城区或东城区等行政区。可选地,大区域为北京,若依据特定道路划分方式,则目标区域可以为三环以内区域。
目标区域内的各基站,能够收集到目标区域内手机用户的手机信令数据,该手机信令信息能够反映出手机用户的号码所属地、手机用户经过的位置,以及手机用户在每一个位置的停留时间以及停留时长。基于手机用户的手机信令数据便可对目标区域内的人口结构进行划分,将目标区域内的手机用户交叉划分为至少两个人口组。
在根据目标区域中手机用户的手机信令数据对手机用户进行交叉分组的具体分组方式可以根据具体的业务需求确定,且至少包括如下三种:
第一种,将手机用户的手机信令数据与预设的用户分组条件进行比对,这里所述的用户分组条件仅为与常住人口相关的分组条件。根据手机用户的手机信令数据和用户分组条件的对比结果,将目标区域内的手机用户划分至与常住人口相关的人口组。
第二种,将手机用户的手机信令数据与预设的用户分组条件进行比对,这里所述的用户分组条件仅为与流动人口相关的分组条件。根据手机用户的手机信令数据和用户分组条件的对比结果,将目标区域内的手机用户划分出与流动人口相关的人口组。
第三种,将手机用户的手机信令数据与预设的用户分组条件进行比对,这里所述的用户分组条件同时包括有与流动人口相关的分组条件和与常住人口相关的分组条件。根据手机用户的手机信令数据和用户分组条件的对比结果,将目标区域内的手机用户划分出与常住人口相关的人口组和与流动人口相关的人口组。
上述第一种和第三种中所提及的与常住人口相关的人口组可以包括常住人口组、从业人口组、非从业人口组。其中,从业人口组和非从业人口组中的人口与常住人口组的人口存在交叉。上述第二种和第三种中所提及的与流动人口相关的人口组可以包括流动人口组、乘坐公共交通人口组,其中,乘坐公共交通人口组中不仅包括有流动人口,而且与常住人口组、从业人口组以及非从业人口组存在交叉。
下面对与常住人口相关的人口组及与流动人口相关的人口组“常住人口组及流动人口组”的划分过程进行说明,该划分过程为:从目标区域的手机用户的手机信令数据中提取各手机用户的第一参数,其中,该第一参数包括如下中的至少一种:所述手机用户的号码归属地、所述手机用户在所述目标区域的驻留天数、所述手机用户驻留时的驻留时长和驻留时间段。将第一参数达到预设的第一用户分组条件的手机用户划分至常住人口组。将第一参数未达到预设的第一用户分组条件的手机用户划分至流动人口组。需要说明的是,第一用户分组条件需要基于从手机信令数据中提取的第一参数的种类确定。示例性的,当第一参数包括手机用户的号码归属地、手机用户在所述目标区域的驻留天数、手机用户驻留时的驻留时长和驻留时间段时,则第一用户分组条件为:号码归属地为“特定地点”、手机用户在目标区域的驻留天数大于预设的第一天数阈值、手机用户驻留时的驻留时长大于预设的第一时长以及驻留时间段为预设的第一时间段。当一个手机用户的第一参数均达到第一用户分组条件,则将该手机用户划分至常驻人口组。当一个手机用户的第一参数中存在一个或多个未达到第一用户分组条件,则将该手机用户划分至流动人口组。
下面对与常住人口相关的人口组“从业人口组和非从业人口组”的划分过程进行说明,该划分过程为:从目标区域的手机用户的手机信令数据中提取各手机用户的第二参数,其中,第二参数包括如下中的至少一种:所述手机用户在预设时间段的出行频率、所述手机用户日均出行次数。将第二参数达到预设的第二用户分组条件的手机用户划分至从业人口组;将第二参数未达到预设的第二用户分组条件的手机用户划分至非从业人口组。从业人口组和非从业人口组均与常住人口组存在人口交叉,从业人口组和非从业人口组以常住人口组的手机用户为人口基准进行划分。需要说明的是,第二用户分组条件需要基于从手机信令数据中提取的第二参数的种类确定。示例性的,当第二参数包括手机用户在预设时间段的出行频率、手机用户日均出行次数时,则第二用户分组条件为:手机用户在预设时间段“第二时间段”的出行频率大于预设第一频率、手机用户日均出行次数大于预设次数阈值。当一个手机用户的第三参数均达到第二用户分组条件,则将该手机用户划分至从业人口组。当一个手机用户的第二参数中存在一个或多个未达到第二用户分组条件,则将该手机用户划分至非从业人口组。
下面对与流动人口相关的人口组“乘坐公共交通人口组”的划分过程进行说明,该划分过程为:从目标区域的手机用户的手机信令数据中提取各手机用户的第三参数,其中,第三参数包括手机用户在特定公共交通站点的定位信息;将第三参数达到预设的第三用户分组条件的手机用户划分至乘坐公共交通人口组。乘坐公共交通人口组与常住人口组、从业人口组、非从业人口组和流动人口组均存在人口交叉,只要目标区域中的手机用户的第三参数满足第三用户分组条件,便将其划分至乘坐公共交通人口组。需要说明的是,第三参数“手机用户在特定公共交通站点的定位信息”是基于特定公共交通站点所对应的特定基站与手机之间的手机信令数据而定的,也就是说,手机用户到达过特定公共交通站点,则其手机信令数据中必然存在特定公共交通站点的定位信息。可选的,特定公共交通站点可以为任意一个或多个地铁站点。另外,第三用户分组条件需要基于从手机信令数据中提取的第三参数的种类确定。示例性的,第三参数为手机用户在特定公共交通站点的定位信息,则第三用户分组条件为:手机用户在第一预设公交交通站点的定位信息。当一个手机用户的第三参数中包括有第一预设公交交通站点的定位信息,则确定该第三参数达到第三用户分组条件,则将该手机用户划分至乘坐公共交通人口组。当一个手机用户的第三参数中不包括有第一预设公交交通站点的定位信息,则确定该第三参数未达到第三用户分组条件,则不将该手机用户划分至乘坐公共交通人口组。
通过上述对常住人口组、流动人口组、从业人口组、非从业人口组和乘坐公共交通人口组的划分过程可知,各人口组按照目标区域内手机用户的人口结构进行交叉划分,各组之间的人口存在交叉。各人口组的划分为针对不同特征人口分别扩样提供了依据,且可以根据各人口组对扩样系数进行确认,可以为扩样系数的调校和验证提供依据,从而使得在依据扩样系数对目标区域内的人口测算时,能够更为精细化,且人口测算结果能够满足交通领域等不同类型人口交通出行分析的需求。
进一步的,在划分出各人口组之后,可对每个人口组中的手机用户总量进行分别统计,以为后续进行各人口组的扩样系数的确定提供计算依据。
102、基于各所述人口组的官方统计数据和手机用户总量,确定各人口组扩样系数。
在实际应用中,各人口组的官方统计数据可从官方的服务平台中去获取,该官方服务平台中存在有官方或权威机构调查到各人口组所对应的官方统计数据。比如,常住人口组对应的官方统计数据为官方或权威机构调查到的目标区域中的常住人口总量,该常住人口总量为官方统计人口总量,其所涉及的人口包括手机用户和非手机用户。另外,官方统计数据除包括官方统计人口总量外还可以包括官方统计公共交通客流量、官方统计运营商市场占有率。其中,官方统计公共交通客流量数据可以从相关研究机构获取;官方运营商市场占有率可以从相关运营商处获取。
基于各人口组的官方统计数据和手机用户总量确定各人口组的扩样系数的具体过程与划分出的人口组的类型有关,且至少包括如下几种:
第一种,根据与常住人口相关的人口组的官方统计人口总量和手机用户总量,确定与常住人口相关的人口组扩样系数,与常住人口相关的人口组扩样系数包括从业人口扩样系数和/或非从业人口扩样系数。
具体的,确定从业人口扩样系数和/或非从业人口扩样系数的方法包括如下几种:
(一)将所述从业人口组的官方从业人口总量与所述从业人口组的手机用户总量的比值,确定为所述从业人口扩样系数。
(二)将所述非从业人口组的官方非从业人口总量与所述非从业人口组的手机用户总量的比值,确定为所述非从业人口扩样系数。
示例性的,目标区域的非从业人口组的官方非从业人口总量为其中,为目标区域的常住人口组的官方常用人口总量,为目标区域的从业人口组的官方从业人口总量。将目标区域的非从业人口组的官方非从业人口总量与非从业人口组的手机用户总量的比值,确定为非从业人口扩样系数,该非从业人口扩样系数为
第二种,根据与流动人口相关的人口组的官方统计人口总量、官方统计公共交通客流量、官方统计运营商市场占有率中的任意一种和手机用户总量,确定流动人口扩样系数。
具体的,确定流动人口扩样系数的方法包括如下几种:
(一)将所述常住人口组的官方统计常住人口总量与所述常住人口组的手机用户总量的比值,确定为所述流动人口扩样系数。
(二)将1与所述目标区域中目标运营商的市场占有率的比值,确定为所述流动人口扩样系数。
示例性的,目标区域中目标运营商的市场占有率为OCCA,则流动人口扩样系数为需要说明的是,目标运营商可以移动、联通、电信等多家运营商中任意一种,此种方式,能够使用一个运营商的市场占有率扩样出目标区域中所有运营商的手机用户的数量,可以增加扩样准确度,从而有利于准确对目标区域中人口进行测算。
(三)将各公共交通站点的官方总客流量与所述乘坐公共交通人口组中手机用户在各公共交通站点的手机用户总量的比值的加权和,确定为所述流动人口扩样系数。
第三种,根据与流动人口相关的人口组的官方统计人口总量、官方统计公共交通客流量、官方统计运营商市场占有率中的至少两种;根据流动人口扩样系数差异性,确定各人口组的扩样系数。
具体的,将所述常住人口组的官方统计常住人口总量与所述常住人口组的手机用户总量的比值、1与所述目标区域中目标运营商的市场占有率的比值、将各公共交通站点的官方总客流量与所述乘坐公共交通人口组中手机用户在各公共交通站点的手机用户总量的比值的加权和中的至少两种,确定为所述流动人口扩样系数。
综合上述(一)至(三)的流动人口扩样系数的确定方法,将所选用的至少两种方法所确定的流动人口扩样系数,均确定为目标区域的流动人口扩样系数。
具体的,根据流动人口扩样系数确定扩样系数的方法与流动人口扩样系数的数量有关。示例性的,若流动人口扩样系数,仅为上述(一)至(三)中任意一种确定出的一个流动人口扩样系数,则直接将所确定的一个流动人口扩样系数确定为目标区域的扩样系数即可。示例性的,为了提高扩样系数的准确性,则流动人口扩样系数,可为上述(一)至(三)确定出的至少两个流动人口扩样系数,则将上述至少两个流动人口扩样系数的加权平均值确定为目标区域的扩样系数。
具体地,为了降低扩样的误差,则在采用流动人口扩样系数确定方法确定出的至少两个流动人口扩样系数之后,在确定目标区域的扩样系数之前,还可以对至少两个流动人口扩样系数进行调校和验证,该调校和验证的方法可以为:确定至少两个流动人口扩样系数之前的差异性是否满足差异要求,若满足要求,则将上述至少两个流动人口扩样系数的加权平均值确定为目标区域的扩样系数。若不满足要求,则说明目标区域中各人口组的划分不准确,则需要重新设定用户分组条件,并根据目标区域内的手机用户的手机信令数据和重新设定的用户分组条件的对比结果,将手机用户重新划分出人口组,以根据重新划分的人口组,重新计算两个常住人口扩样系数,直至至少两个流动人口扩样系数之间的差异性满足差异要求。需要说明的是,该差异性可以包括但不限于至少两个流动人口扩样系数之间的差值绝对值,若差值绝对值小于预设的差值阈值,则说明满足差异要求。
103、基于所述各人口组的扩样系数,对所述目标区域进行人口测算。
在实际应用中,在对目标区域进行人口测算时,主要是将目标区域所述不同人口组的扩样系数分别与目标区域内的不同人口组手机用户的总量的乘积求和,确定为目标区域内的人口总量。
示例性的,步骤101中划分出了两个人口组,人口组1的扩样系数为K1,人口组2的扩样系数为K2,人口组1的手机用户总量为T1,人口组2的手机用户总量为T2,则目标区域内的人口总量为“K1×T1+K2×T2”。
可见,由于扩样系数是综合使用了目标区域内的官方统计人口总量、官方统计公共交通客流量、官方统计运营商市场占有率等不同数据源进行综合扩样而得,因此避免了依据单一数据源偏差导致的扩样误差,能够有效提高基于手机信令数据的人口测算准确度。
本发明实施例提供的基于手机信令数据的人口测算方法,能够根据目标区域中手机用户的手机信令数据,将目标区域内的手机用户交叉划分为至少两个人口组,并确定每个人口组的手机用户总量。然后基于各人口组的官方统计人口总量、官方统计公共交通客流量、官方统计运营商市场占有率等官方统计数据和手机用户总量确定各人口组的扩样系数,并基于所确定的扩样系数,对目标区域进行人口测算。可见,本发明实施例在确定扩样系数时不仅考虑了目标区域中不同人口结构和特征,而且综合使用了官方统计人口总量、官方运营商市场占有率和官方公共交通客流量等官方统计数据,因此本发明实施例能够提高扩样系数的准确度,从而提高基于手机信令数据的人口测算准确度。
进一步的,根据图1所示的方法,本发明的另一个实施例还提供了一种基于手机信令数据的人口测算方法,以划分出的人口组包括常住人口组、流动人口组、从业人口组、非从业人口组、乘坐公共交通人口组。如图2所示,所述方法主要包括:
201、从目标区域的手机用户的手机信令数据中提取各手机用户的第一参数。
其中,该第一参数包括如下中的至少一种:所述手机用户的号码归属地、所述手机用户在所述目标区域的驻留天数、所述手机用户驻留时的驻留时长和驻留时间段。
202、将所述第一参数达到预设的第一用户分组条件的手机用户划分至常住人口组;将所述第一参数未达到预设的第一用户分组条件的手机用户划分流动人口组。
203、从所述目标区域的手机用户的手机信令数据中提取各手机用户的第二参数。
其中,所述第二参数包括如下中的至少一种:所述手机用户在预设时间段的出行频率、所述手机用户日均出行次数;
204、将所述第二参数达到预设的第二用户分组条件的手机用户划分至从业人口组。
205、将所述第二参数未达到预设的第二用户分组条件的手机用户划分至非从业人口组。
206、从所述目标区域的手机用户的手机信令数据中提取各手机用户的第三参数。
其中,所述第三参数包括所述手机用户在至少一个特定公共交通站点的定位信息;
207、将所述第三参数达到预设的第三用户分组条件的手机用户划分至乘坐公共交通人口组。
208、将所述从业人口组的官方从业人口总量与所述从业人口组的手机用户总量的比值,确定为从业人口扩样系数;所述非从业人口组的官方非从业人口总量与所述非从业人口组的手机用户总量的比值,确定为非从业人口扩样系数。
209、将所述常住人口组的官方常住人口总量与所述常住人口组的手机用户总量的比值、1与所述目标区域中目标运营商的市场占有率的比值、将各公共交通站点的官方总客流量与所述乘坐公共交通人口组中手机用户在各公共交通站点的手机用户总量的比值的加权和,均确定为所述流动扩样系数。
210、确定所述不同的流动扩样系数的差异性是否满足差异要求;若不满足,执行211;否则,执行212。
211、重新设定用户分组条件,并执行201。
其中,重新设定的用户分组条件包括第一用户分组条件、第二用户分组套件和第三用户分组条件。执行步骤201的目的在于根据手机用户的手机信令数据和重新设定的用户分组条件的对比结果,将所述手机用户重新划分出常住人口组、流动人口组、从业人口组、非从业人口组、乘坐公共交通人口组,直至各所述流动扩样系数的差异性满足差异要求。
212、基于各所述人口组的官方统计数据和手机用户总量,确定各人口组的扩样系数。
213、将所述目标区域所述不同人口组的扩样系数分别与所述目标区域内所述不同人口组手机用户的总量的乘积求和,确定为所述目标区域内不同人口组的人口总量。
进一步的,为了判断人口测算结果是否能够应用到诸如交通出行分析等场景中,则在对目标区域进行人口测算得到测试结果“人口总量”后,需要执行如下判断过程:采用另外一种区域划分方式划分出一个特定区域,确定该特征区域内的手机用户总量该手机用户总量是用目标区域的扩样系数与特定区域内已知的手机用户总量乘积而得,确定该特定区域内的官方常住人口总量确定手机用户总量与官方常住人口总量之间的差异(比如,差值)是否在预设的范围内,若不在预设的范围,则说明扩样系数误差较大,说明对目标区域进行人口测算得到测试结果“人口总量”不可用,需要重新执行步骤211。若在预设的范围内,则说明扩样系数较为精确,则说明对目标区域进行人口测算得到测试结果“人口总量”可用。
示例性的,如图3所示,为以北京市各行政区分别目标区域进行基于手机信令数据的人口测算后,北京市各行政区常住人口组手机用户扩样结果后人口测算结果与官方统计人口总量之间的对比展示,对比两个总量之间的误差为4%,说明基于手机信令数据的人口测算准确度。
进一步的,依据上述方法实施例,本发明的另一个实施例还提供了一种基于手机信令数据的人口测算装置,如图4所示,所述装置包括:
划分单元31,用于根据目标区域中手机用户的手机信令数据,将所述目标区域内的手机用户交叉划分为至少两个人口组,并确定每个所述人口组的手机用户总量;
确定单元32,用于基于各所述人口组的官方统计数据和手机用户总量,确定各人口组的扩样系数;
测算单元33,用于基于所述扩样系数,对所述目标区域进行人口测算。
本发明实施例提供的基于手机信令数据的人口测算装置,能够根据目标区域中手机用户的手机信令数据,将目标区域内的手机用户交叉划分为至少两个人口组,并确定每个人口组的手机用户总量。然后基于各人口组的官方统计人口总量、官方统计公共交通客流量、官方统计运营商市场占有率等官方统计数据和手机用户总量确定各人口组的扩样系数,并基于所确定的扩样系数,对目标区域进行人口测算。可见,本发明在确定扩样系数时不仅考虑了目标区域中不同人口结构和特征,而且综合使用了官方统计人口总量、官方运营商市场占有率和官方公共交通客流量等官方统计数据,因此本发明实施例能够提高扩样系数的准确度,从而提高基于手机信令数据的人口测算准确度。
可选的,如图5所示,划分单元31,用于根据所述手机用户的手机信令数据和预设的用户分组条件的对比结果,将所述手机用户划分出与常住人口相关的人口组,和/或,划分出与流动人口相关的人口组,其中,所述与常住人口相关的人口组包括如下中的至少一种:常住人口组、从业人口组、非从业人口组,所述与流动人口相关的人口组包括如下中至少一种:流动人口组、乘坐公共交通人口组。
可选的,如图5所示,划分单元31包括:
第一划分模块311,用于从所述目标区域的手机用户的手机信令数据中提取各手机用户的第一参数,其中,所述第一参数包括如下中的至少一种:所述手机用户的号码归属地、所述手机用户在所述目标区域的驻留天数、所述手机用户驻留时的驻留时长和驻留时间段;将所述第一参数达到预设的第一用户分组条件的手机用户划分至常住人口组;将所述第一参数未达到预设的第一用户分组条件的手机用户划分至流动人口组。
可选的,如图5所示,划分单元31包括:
第二划分模块312,用于从所述目标区域的手机用户的手机信令数据中提取各手机用户的第二参数,其中,所述第二参数包括如下中的至少一种:所述手机用户在预设时间段的出行频率、所述手机用户日均出行次数;将所述第二参数达到预设的第二用户分组条件的手机用户划分至从业人口组;将所述第二参数未达到预设的第二用户分组条件的手机用户划分至非从业人口组。
可选的,如图5所示,划分单元31包括:
第三划分模块313,用于从所述目标区域的手机用户的手机信令数据中提取各手机用户的第三参数,其中,所述第三参数包括所述手机用户在至少一个特定公共交通站点的定位信息;将所述第三参数达到预设的第三用户分组条件的手机用户划分至乘坐公共交通人口组。
可选的,如图5所示,确定单元32包括:
第一确定模块321,用于根据与常住人口相关的人口组的官方统计人口总量和手机用户总量,确定与常住人口相关的人口组扩样系数,所述与常住人口相关的人口组扩样系数包括从业人口扩样系数和/或非从业人口扩样系数;和/或,
第二确定模块322,用于根据与流动人口相关的人口组的官方统计人口总量、官方统计公共交通客流量、官方统计运营商市场占有率中的至少一种和手机用户总量,确定流动人口扩样系数;根据所述流动人口扩样系数,确定各人口组的扩样系数。
可选的,如图5所示,第一确定模块321,用于将所述从业人口组的官方从业人口总量与所述从业人口组的手机用户总量的比值,确定为所述从业人口扩样系数;
和/或,
第一确定模块321,用于将所述非从业人口组的官方非从业人口总量与所述非从业人口组的手机用户总量的比值,确定为所述非从业人口扩样系数。
可选的,如图5所示,第一确定模块321,用于将所述常住人口组的官方统计常住人口总量与所述常住人口组的手机用户总量的比值、1与所述目标区域中目标运营商的市场占有率的比值、将各公共交通站点的官方总客流量与所述乘坐公共交通人口组中手机用户在各公共交通站点的手机用户总量的比值的加权和中的至少一种,确定为所述流动人口扩样系数。
可选的,如图5所示,确定单元32,还用于在确定扩样系数之前,确定所述流动人口扩样系数的差异性是否满足差异要求;若不满足,则触发划分单元31重新设定用户分组条件,并执行根据手机用户的手机信令数据和重新设定的用户分组条件的对比结果,将所述手机用户重新划分出与常住人口相关的人口组和/或与流动人口相关的人口组,以根据重新划分的人口组重新计算所述从业人口扩样系数和/或所述非从业人口扩样系数和/或所述流动人口扩样系数,直至所述所述流动人口扩样系数的差异性满足差异要求。
可选的,如图5所示,测算单元33,用于将所述目标区域的不同人口组扩样系数分别与所述目标区域内的不同人口组手机用户的总量的乘积求和,确定为所述目标区域内不同人口组的人口总量。
本发明实施例提供的基于手机信令数据的人口测算装置中,各个功能模块运行过程中所采用的方法详解可以参见图1至图2方法实施例的对应方法详解,在此不再赘述。
进一步的,依据上述实施例,本发明的另一个实施例还提供了计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的基于手机信令数据的人口测算方法。
进一步的,依据上述实施例,本发明的另一个实施例还提供了一种存储管理设备,所述存储管理设备包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于运行所述程序以执行上述中任意一项所述的基于手机信令数据的人口测算方法。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
可以理解的是,上述方法及装置中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的深度神经网络模型的运行方法、装置及框架中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (10)
1.一种基于手机信令数据的人口测算方法,其特征在于,包括:
根据目标区域中手机用户的手机信令数据,将所述目标区域内的手机用户交叉划分为至少两个人口组,并确定每个所述人口组的手机用户总量;
基于各所述人口组的官方统计数据和手机用户总量,确定各人口组的扩样系数;
基于所述扩样系数,对所述目标区域进行人口测算。
2.根据权利要求1所述的方法,其特征在于,根据目标区域中手机用户的手机信令数据,将所述目标区域内的手机用户交叉划分为至少两个人口组,包括:
根据所述手机用户的手机信令数据和预设的用户分组条件的对比结果,将所述手机用户划分出与常住人口相关的人口组,和/或,划分出与流动人口相关的人口组,其中,所述与常住人口相关的人口组包括如下中的至少一种:常住人口组、从业人口组、非从业人口组,所述与流动人口相关的人口组包括如下中至少一种:流动人口组、乘坐公共交通人口组。
3.根据权利要求2所述的方法,其特征在于,根据手机用户的手机信令数据和预设的用户分组条件的对比结果,将所述手机用户划分出与常住人口相关的人口组和与流动人口相关的人口组,包括:
从所述目标区域的手机用户的手机信令数据中提取各手机用户的第一参数,其中,所述第一参数包括如下中的至少一种:所述手机用户的号码归属地、所述手机用户在所述目标区域的驻留天数、所述手机用户驻留时的驻留时长和驻留时间段;
将所述第一参数达到预设的第一用户分组条件的手机用户划分至常住人口组;
将所述第一参数未达到预设的第一用户分组条件的手机用户划分至流动人口组;
和/或,
根据手机用户的手机信令数据和预设的用户分组条件的对比结果,将所述手机用户划分至与常住人口相关的人口组,包括:
从所述目标区域的手机用户的手机信令数据中提取各手机用户的第二参数,其中,所述第二参数包括如下中的至少一种:所述手机用户在预设时间段的出行频率、所述手机用户日均出行次数;
将所述第二参数达到预设的第二用户分组条件的手机用户划分至从业人口组;
将所述第二参数未达到预设的第二用户分组条件的手机用户划分至非从业人口组;
和/或,
根据手机用户的手机信令数据和用户分组条件的对比结果,将所述手机用户划分至与流动人口相关的人口组,包括:
从所述目标区域的手机用户的手机信令数据中提取各手机用户的第三参数,其中,所述第三参数包括所述手机用户在至少一个特定公共交通站点的定位信息;
将所述第三参数达到预设的第三用户分组条件的手机用户划分至乘坐公共交通人口组。
4.根据权利要求2所述的方法,其特征在于,基于各所述人口组的官方统计数据和手机用户总量,确定各人口组的扩样系数,包括:
根据与常住人口相关的人口组的官方统计人口总量和手机用户总量,确定与常住人口相关的人口组扩样系数,所述与常住人口相关的人口组扩样系数包括从业人口扩样系数和/或非从业人口扩样系数;
和/或,
根据与流动人口相关的人口组的官方统计人口总量、官方统计公共交通客流量、官方统计运营商市场占有率中的至少一种和手机用户总量,确定流动人口扩样系数;根据所述流动人口扩样系数,确定各人口组的扩样系数。
5.根据权利要求4所述的方法,其特征在于,根据与常住人口相关的人口组的官方统计人口总量和手机用户总量,确定与常住人口相关的人口组扩样系数,包括:
将所述从业人口组的官方从业人口总量与所述从业人口组的手机用户总量的比值,确定为所述从业人口扩样系数;
和/或,
根据与常住人口相关的人口组的官方统计人口总量和手机用户总量,确定与常住人口相关的人口组扩样系数,包括:
将所述非从业人口组的官方非从业人口总量与所述非从业人口组的手机用户总量的比值,确定为所述非从业人口扩样系数;
和/或,
根据与流动人口相关的人口组的官方统计人口总量、官方统计公共交通客流量、官方统计运营商市场占有率和手机用户总量,确定流动人口扩样系数,包括:
将所述常住人口组的官方统计常住人口总量与所述常住人口组的手机用户总量的比值、1与所述目标区域中目标运营商的市场占有率的比值、将各公共交通站点的官方总客流量与所述乘坐公共交通人口组中手机用户在各公共交通站点的手机用户总量的比值的加权和中的至少一种,确定为所述流动人口扩样系数。
6.根据权利要求4所述的方法,其特征在于,在确定扩样系数之前,包括:
确定所述流动人口扩样系数的差异性是否满足差异要求;
若不满足,则重新设定用户分组条件,并执行根据手机用户的手机信令数据和重新设定的用户分组条件的对比结果,将所述手机用户重新划分出与常住人口相关的人口组和/或与流动人口相关的人口组,以根据重新划分的人口组重新计算所述从业人口扩样系数和/或所述非从业人口扩样系数和/或所述流动人口扩样系数,直至所述流动人口扩样系数的差异性满足差异要求。
7.根据权利要求1所述的方法,其特征在于,基于所述扩样系数,对所述目标区域进行人口测算,包括:
将所述目标区域的不同人口组扩样系数分别与所述目标区域内的不同人口组手机用户的总量的乘积求和,确定为所述目标区域内不同人口组的人口总量。
8.一种基于手机信令数据的人口测算装置,其特征在于,包括:
划分单元,用于根据目标区域中手机用户的手机信令数据,将所述目标区域内的手机用户交叉划分为至少两个人口组,并确定每个所述人口组的手机用户总量;
确定单元,用于基于各所述人口组的官方统计数据和手机用户总量,确定各人口组的扩样系数;
测算单元,用于基于所述扩样系数,对所述目标区域进行人口测算。
9.一种计算机可读存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求7中任意一项所述的基于手机信令数据的人口测算方法。
10.一种存储管理设备,其特征在于,所述存储管理设备包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于运行所述程序以执行权利要求1至权利要求7中任意一项所述的基于手机信令数据的人口测算方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010779861.XA CN111866776A (zh) | 2020-08-05 | 2020-08-05 | 一种基于手机信令数据的人口测算方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010779861.XA CN111866776A (zh) | 2020-08-05 | 2020-08-05 | 一种基于手机信令数据的人口测算方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111866776A true CN111866776A (zh) | 2020-10-30 |
Family
ID=72972193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010779861.XA Pending CN111866776A (zh) | 2020-08-05 | 2020-08-05 | 一种基于手机信令数据的人口测算方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111866776A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113873451A (zh) * | 2021-09-28 | 2021-12-31 | 全民认证科技(杭州)有限公司 | 一种基于基站负载平衡的流动人口判别方法 |
CN113919873A (zh) * | 2021-09-30 | 2022-01-11 | 中国联合网络通信集团有限公司 | 市场容量的确定方法、装置、设备及存储介质 |
CN113993120A (zh) * | 2021-12-30 | 2022-01-28 | 中国移动紫金(江苏)创新研究院有限公司 | 一种基于无线用户信令的人口统计方法及系统 |
CN116170761A (zh) * | 2023-04-25 | 2023-05-26 | 北京城建交通设计研究院有限公司 | 一种手机信令数据综合扩样校核方法及系统 |
CN117131335A (zh) * | 2023-10-23 | 2023-11-28 | 北京艾瑞数智科技有限公司 | 一种基于信令数据的人口分析方法及相关产品 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583640A (zh) * | 2018-11-23 | 2019-04-05 | 东南大学 | 一种基于多源定位数据的城市出行客流属性识别方法 |
CN111428197A (zh) * | 2020-03-18 | 2020-07-17 | 北京城市象限科技有限公司 | 数据处理方法、装置及设备 |
-
2020
- 2020-08-05 CN CN202010779861.XA patent/CN111866776A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583640A (zh) * | 2018-11-23 | 2019-04-05 | 东南大学 | 一种基于多源定位数据的城市出行客流属性识别方法 |
CN111428197A (zh) * | 2020-03-18 | 2020-07-17 | 北京城市象限科技有限公司 | 数据处理方法、装置及设备 |
Non-Patent Citations (1)
Title |
---|
杨彬彬: "基于手机信令数据的城市轨道交通客流特征研究", 《中国优秀硕士学位论文全文数据库(工程科技II辑)》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113873451A (zh) * | 2021-09-28 | 2021-12-31 | 全民认证科技(杭州)有限公司 | 一种基于基站负载平衡的流动人口判别方法 |
CN113919873A (zh) * | 2021-09-30 | 2022-01-11 | 中国联合网络通信集团有限公司 | 市场容量的确定方法、装置、设备及存储介质 |
CN113993120A (zh) * | 2021-12-30 | 2022-01-28 | 中国移动紫金(江苏)创新研究院有限公司 | 一种基于无线用户信令的人口统计方法及系统 |
CN116170761A (zh) * | 2023-04-25 | 2023-05-26 | 北京城建交通设计研究院有限公司 | 一种手机信令数据综合扩样校核方法及系统 |
CN117131335A (zh) * | 2023-10-23 | 2023-11-28 | 北京艾瑞数智科技有限公司 | 一种基于信令数据的人口分析方法及相关产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111866776A (zh) | 一种基于手机信令数据的人口测算方法及装置 | |
CN114173356A (zh) | 网络质量的检测方法、装置、设备及存储介质 | |
CN112579718B (zh) | 一种城市用地功能的识别方法、装置及终端设备 | |
CN106535204B (zh) | 一种业务覆盖质量评估方法及装置 | |
CN108495254B (zh) | 一种基于信令数据的交通小区人口特征估计方法 | |
CN109842896B (zh) | 一种栅格价值评估方法及装置 | |
CN111738484B (zh) | 一种公交站点选址的方法、装置及计算机可读存储介质 | |
CN109495897B (zh) | Lte网络问题区域化聚合方法及装置 | |
CN104320789A (zh) | 一种基于博弈论的车联网rsu最优配置方法 | |
CN114885369A (zh) | 网络覆盖质量检测处理方法、装置、电子设备和存储介质 | |
CN109995549B (zh) | 一种评估流量价值的方法及装置 | |
CN111143639A (zh) | 用户亲密度计算方法、装置、设备及介质 | |
CN113407906B (zh) | 一种基于手机信令数据的交通出行分布阻抗函数的确定方法 | |
CN108921214A (zh) | 城市属性的获取方法、装置及计算机可读存储介质 | |
CN111242723B (zh) | 用户子女情况判断方法、服务器及计算机可读存储介质 | |
CN106528559A (zh) | 一种位置信息的提供方法和设备 | |
CN107231635B (zh) | 一种网络覆盖的分析方法及装置 | |
CN108171534B (zh) | 一种车载广告公交线路推荐方法及装置 | |
CN104486782B (zh) | 一种基站站址价值的获取方法及系统 | |
CN108171970A (zh) | 一种获取公交车乘客轨迹的方法及装置 | |
CN113573236B (zh) | 定位结果的置信度的评估方法和装置 | |
CN113887038A (zh) | 一种建筑能耗预测校核方法、装置、设备及存储介质 | |
CN107979818B (zh) | 一种无线指纹库初始数据的处理方法 | |
CN109874170B (zh) | 地理坐标系盲检测方法、装置、设备及介质 | |
CN110400160B (zh) | 识别竞品用户的方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201030 |