CN110992230B - 基于终端信令数据的全量人口统计方法、装置及服务器 - Google Patents
基于终端信令数据的全量人口统计方法、装置及服务器 Download PDFInfo
- Publication number
- CN110992230B CN110992230B CN201911188278.5A CN201911188278A CN110992230B CN 110992230 B CN110992230 B CN 110992230B CN 201911188278 A CN201911188278 A CN 201911188278A CN 110992230 B CN110992230 B CN 110992230B
- Authority
- CN
- China
- Prior art keywords
- demographic
- population
- scale
- operator
- cards
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000011664 signaling Effects 0.000 title claims abstract description 47
- 238000012545 processing Methods 0.000 claims abstract description 52
- 238000012216 screening Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 7
- 238000013178 mathematical model Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 230000000366 juvenile effect Effects 0.000 claims description 3
- 238000011835 investigation Methods 0.000 abstract description 5
- 238000011161 development Methods 0.000 description 9
- 230000008030 elimination Effects 0.000 description 6
- 238000003379 elimination reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了基于终端信令数据的全量人口统计方法、装置及服务器,包括:获取预先设置的人口统计口径规则,基于人口统计口径规则在运营商的数据库中查找对应的有效号卡数;基于运营商的市占率,根据市占率对有效号卡数进行扩样处理,以得到运营商的全量终端用户数;按照人口抚养比对全量终端用户数进行计量,以得到当前人口统计口径规则对应的全量人口数量。本申请缓解了现有技术中统计出的人口数量准确性较低以及传统入户调查代价高的问题,从而更加准确的对全量人口数量进行统计。
Description
技术领域
本发明涉及数据统计技术领域,尤其是涉及基于终端信令数据的全量人口统计方法、装置及服务器。
背景技术
人口是国民经济和社会发展的主体,以人为本的理念,是科学发展观的核心。同时城镇化的本质,是人口的城镇化,这就决定了城市居民数量在统计城市管理中的重要作用。事实上,城市居民是城市空间的主体,居民行为与活动的变化会影响城市的空间组织与结构,城市居民数量统计是进行城市规划、交通规划及城市管理的一项常规工作,因此,周期性的交通调查、人口普查等工作一直在实施。
传统的人口普查方案,主要是采用入户抽样调查的方式,这种方式存在周期长、频率低、结果滞后的缺点,且,普查结果易受样本因素的影响,从而无法适应经济社会的高速发展,满足不了当前对人口监测和管理工作时效性的需求。随着社会信息化进程的加快,现有的大多方法则是直接利用手机信令数据进行人口统计,往往导致统计出的人口数量准确性较低。
发明内容
有鉴于此,本发明的目的在于提供基于终端信令数据的全量人口统计方法、装置及服务器,以缓解现有技术中统计出的人口数量准确性较低以及传统入户调查代价高的问题,从而更加准确的对全量人口数量进行统计。
第一方面,本发明实施例提供了一种基于终端信令数据的全量人口统计方法,应用于服务器,所述方法包括:
获取预先设置的人口统计口径规则,基于所述人口统计口径规则在运营商的数据库中查找对应的有效号卡数;
基于所述运营商的市占率,根据所述市占率对所述有效号卡数进行扩样处理,以得到所述运营商的全量终端用户数;
按照人口抚养比对所述全量终端用户数进行计量,以得到当前所述人口统计口径规则对应的全量人口数量。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述基于所述人口统计口径规则在运营商的数据库中查找对应的有效号卡数的步骤包括:
获取统计区域和统计时段内的所述运营商的数据库的号卡总数;
基于人口统计口径规则,按照所述统计区域对应的空间尺度对所述号卡总数进行筛选,以得到当前统计区域内的有效号卡数。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述空间尺度为地级空间尺度,包括省级空间尺度、市级空间尺度、区县级空间尺度。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述按照所述统计区域对应的空间尺度对所述号卡总数进行筛选,以得到当前统计区域内的有效号卡数的步骤包括:
对筛选后得到的号卡数进行剔除处理,以得到第一号卡数;
对所述第一号卡数进行去重处理,以得到所述有效号卡数。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述基于所述运营商的市占率,根据所述市占率对所述有效号卡数进行扩样处理,以得到所述运营商的全量终端用户数的步骤包括:
根据运营商的用户位置信息和通话关系数据推算得到所述运营商的市占率;
根据所述市占率,将所述有效号卡数进行扩样处理,以得到当前所述人口统计口径规则对应的所述运营商的全量终端用户数。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述按照人口抚养比对所述全量终端用户数进行计量,以得到当前所述人口统计口径规则对应的全量人口数量的步骤还包括:
基于所述运营商的开卡用户的年龄特征,对所述全量终端用户数进行筛选,以得到指定年龄段的全量终端用户数;
获取校准后的终端普及率,根据所述指定年龄段的全量终端用户数得到指定年龄段的人口总规模数;
利用人口抚养比对所述指定年龄段的人口总规模数进行计量,以得到当前所述人口统计口径规则对应的全量人口数量。
结合第一方面的第五种可能的实施方式,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述人口抚养比包括少儿抚养比和老年抚养比,所述指定年龄段为15~64岁。
第二方面,本发明实施例还提供一种基于终端信令数据的全量人口统计装置,应用于服务器,所述装置包括:
获取模块,用于获取预先设置的人口统计口径规则,基于所述人口统计口径规则在运营商的数据库中查找对应的有效号卡数;
处理模块,用于基于所述运营商的市占率,根据所述市占率对所述有效号卡数进行扩样处理,以得到所述运营商的全量终端用户数;
计量模块,用于按照人口抚养比对所述全量终端用户数进行计量,以得到当前所述人口统计口径规则对应的全量人口数量。
第三方面,本发明实施例还提供一种服务器,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面所述的基于终端信令数据的全量人口统计方法的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行第一方面所述的基于终端信令数据的全量人口统计方法的步骤。
本发明实施例带来了以下有益效果:
本发明实施例提供了基于终端信令数据的全量人口统计方法、装置及服务器,包括:获取预先设置的人口统计口径规则,基于人口统计口径规则在运营商的数据库中查找对应的有效号卡数;基于运营商的市占率,根据市占率对有效号卡数进行扩样处理,以得到运营商的全量终端用户数;按照人口抚养比对全量终端用户数进行计量,以得到当前人口统计口径规则对应的全量人口数量。本申请缓解了现有技术中统计出的人口数量准确性较低以及传统入户调查代价高的问题,从而更加准确的对全量人口数量进行统计。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于终端信令数据的全量人口统计方法的流程图;
图2为本发明实施例提供的另一种基于终端信令数据的全量人口统计方法的流程图;
图3为本发明实施例提供的另一种基于终端信令数据的全量人口统计方法的流程图;
图4为本发明实施例提供的另一种基于终端信令数据的全量人口统计方法的流程图;
图5为本发明实施例提供的另一种基于终端信令数据的全量人口统计方法的流程图;
图6为本发明实施例提供的GDP数据与手机普及率的函数关系图;
图7为本发明实施例提供的另一种基于终端信令数据的全量人口统计方法的流程图;
图8为本发明实施例提供的一种基于终端信令数据的全量人口统计装置的示意图。
图标:
10-获取模块;20-处理模块;30-计量模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
传统的人口统计方案,主要是采用入户抽样调查的方式,该方式存在周期长、频率低和结果滞后的特点,且,受样本因素的影响,该方式无法适应经济社会的高速发展,满足不了当前社会对人口监测和管理工作实效性的需求。
随着社会信息化进程的加快,基于移动通信的手机信令数据来统计人口的方案越来越多。对于现有的基于手机信令数据统计人口数量的方案,一方面,由于物联网和车联网的兴起,手机信令数据中会混杂非人的号卡,从而造成基于某一运营商的号卡统计人口数量偏高;此外,对于同一运营商以及不同运营商之间,存在同一用户置办多张号卡的情况,因此,简单根据号卡进行人口统计将会导致统计的人口数量准确性较低;另一方面,当结合电信运营商的市占率时,由于工信部公布的运营商的市占率只涉及到省级空间尺度,而省级空间尺度内各区县分布并不均匀,因此,如果用同一个省级空间尺度运营商的市占率来扩样到省级空间尺度内各区县的人口统计并不合理;最后,由于在实际应用中,老人和孩子通常不适用手机,因此,如果仅仅以手机信令数据以及运营商的市占率进行人口统计,将会导致人口统计的准确性较低。
针对现有技术中统计出的人口数量准确性较低的技术问题,本发明实施例提供了基于终端信令数据的全量人口统计方法、装置及服务器,可以缓解现有技术中统计出的人口数量准确性较低以及传统入户调查代价高的问题,从而更加准确的对全量人口数量进行统计。
为便于对本实施例进行理解,下面首先对本发明实施例提供的一种基于终端信令数据的全量人口统计方法进行详细介绍。
实施例一:
本发明实施例提供了一种基于终端信令数据的全量人口统计方法,应用于服务器,图1为本发明实施例提供的一种基于终端信令数据的全量人口统计方法的流程图,如图1所示,该方法包括以下步骤:
步骤S102,获取预先设置的人口统计口径规则,基于人口统计口径规则在运营商的数据库中查找对应的有效号卡数;
在实际应用中,由于车联网和物联网的兴起,对于某一运营商的号卡存在非人的号卡,以及同一用户拥有多个不同运营商的号卡,因此,为了提高全量人口统计的准确性,本发明实施例是基于某一运营商的有效号卡数进行全量人口数量的统计的,这里对于具体的运营商并不作限制说明。
步骤S104,基于运营商的市占率,根据市占率对有效号卡数进行扩样处理,以得到运营商的全量终端用户数;
这里,考虑到工信部公布的运营商的市占率主要是针对省级空间尺度,为了提高全量人口统计的准确度,本发明实施例中还对工信部公布的运营商的市占率进行优化,从而得到合理空间尺度下的运营商的市占率。
步骤S106,按照人口抚养比对全量终端用户数进行计量,以得到当前人口统计口径规则对应的全量人口数量。
在某一运营商的有效号卡数和优化市占率的基础上,本发明实施例还结合该运营商的开卡用户的年龄特征,并利用人口抚养比对全量终端用户数进行计量,以得到当前人口统计口径规则对应的全量人口数量,从而进一步的提高了全量人口统计的准确性。
本发明实施例提供的基于终端信令数据的全量人口统计方法,包括:获取预先设置的人口统计口径规则,基于人口统计口径规则在运营商的数据库中查找对应的有效号卡数;基于运营商的市占率,根据市占率对有效号卡数进行扩样处理,以得到运营商的全量终端用户数;按照人口抚养比对全量终端用户数进行计量,以得到当前人口统计口径规则对应的全量人口数量。本申请缓解了现有技术中统计出的人口数量准确性较低以及传统入户调查代价高的问题,从而更加准确的对全量人口数量进行统计。
进一步的,在图1的基础上,本发明实施例还提供了另一种基于终端信令数据的全量人口统计方法,图2为本发明实施例提供的另一种基于终端信令数据的全量人口统计方法的流程图,如图2所示,该方法包括以下步骤:
步骤S202,获取预先设置的人口统计口径规则;
具体地,这里预先设置的人口统计口径规则包括以下一种或多种统计逻辑对应的人口统计口径规则:稳定人口、居住人口和工作人口,在实际应用中,可以根据实际统计的情景选取对应的人口统计口径规则,本发明实施例对此不作限制说明。
步骤S204,获取统计区域和统计时段内的运营商的数据库的号卡总数;
步骤S206,基于人口统计口径规则,按照统计区域对应的空间尺度对号卡总数进行筛选,以得到当前统计区域内的有效号卡数;
具体地,这里统计区域对应的空间尺度为地级空间尺度,包括省级空间尺度、市级空间尺度、区县级空间尺度。在实际应用中,根据人口统计口径规则和统计区域对应的空间尺度对某一运营商的号卡总数进行筛选,以得到当前统计区域内的有效号卡数,从而提高全量人口数量统计的准确性。
步骤S208,基于运营商的市占率,根据市占率对有效号卡数进行扩样处理,以得到运营商的全量终端用户数;
步骤S210,按照人口抚养比对全量终端用户数进行计量,以得到当前人口统计口径规则对应的全量人口数量。
进一步的,在图2的基础上,为了得到某一运营商的有效号卡数,本发明实施例还提供了另一种基于终端信令数据的全量人口统计方法,图3为本发明实施例提供的另一种基于终端信令数据的全量人口统计方法的流程图,如图3所示,该方法包括以下步骤:
步骤S302,获取预先设置的人口统计口径规则;
步骤S304,获取统计区域和统计时段内的运营商的数据库的号卡总数;
步骤S306,基于人口统计口径规则,对筛选后得到的号卡数进行剔除处理,以得到第一号卡数;
具体地,这里主要是对某一运营商的号卡数进行非人号卡剔除处理。由于运营商的号卡不都是发给了真实的人,还包括物联网和车联网设备的号卡,因此,为了更加准确的统计全量人口数量,本发明实施例需要对得到的运营商的号卡数进行非人号卡剔除处理,以得到第一号卡数。具体地,本发明实施例可以通过特殊号段以及IMEI(InternationalMobile Equipment Identity,国际移动设备标识)获取的设备类型进行识别,当识别出终端为非人时,则进行剔除处理。特别的,这里只要可以实现终端类型的识别并进行剔除处理的技术即可,具体的识别以及剔除处理方法本发明实施例对此不作限制说明。
步骤S308,对第一号卡数进行去重处理,以得到有效号卡数;
在实际应用中,这里对第一号卡数进行去重处理主要包括网内一人多卡去重处理和网间一人多卡去重处理。其中,网内一人多卡去重处理主要是针对用户在同一运营商有多个号卡的情况,此时需要在该运营商内部进行去重处理,例如,可以利用唯一的ID(Identity Document,身份标识号)识别及同轨识别进行去重处理;而网间一人多卡去重处理主要是针对同一用户在不同运营商中办理多个号卡的情况,由于每个运营商的明细数据具有保密性,因此,网间一人多卡去重处理比较困难,但是,在实际应用中,由于同一用户办理不同运营商的号卡存在分功能使用的现象,大多为一个号卡为主卡,用于日常电话通信;一个则为副卡,用于日常上网等,因此,本发明实施例中,我们可以采取单去重处理实现网间一人多卡去重处理,例如,如果某一用户的某个号卡存在三月无电话呼出的情况,则认为该用户还拥有另一主卡,从而可以将该无电话呼出的号卡进行去重处理,从而得到该用户的有效号卡数。
步骤S310,基于运营商的市占率,根据市占率对有效号卡数进行扩样处理,以得到运营商的全量终端用户数;
步骤S312,按照人口抚养比对全量终端用户数进行计量,以得到当前人口统计口径规则对应的全量人口数量。
进一步的,在图1的基础上,为了得到某一运营商更加合理的市占率,本发明实施例提供了另一种基于终端信令数据的全量人口统计方法,图4为本发明实施例提供的另一种基于终端信令数据的全量人口统计方法的流程图,如图4所示,该方法包括以下步骤:
步骤S402,获取预先设置的人口统计口径规则,基于人口统计口径规则在运营商的数据库中查找对应的有效号卡数;
步骤S404,根据运营商的用户位置信息和通话关系数据推算得到运营商的市占率;
具体地,根据工信部公布的运营商的市占率和该运营商的用户位置信息,并利用通话关系数据通过机器学习推算出该运营商在市级空间尺度和区县级空间尺度的市占率,且,在此基础上,利用头部互联网APP(Application,手机软件)数据推算的市占率及运营商的省级空间尺度得市占率作为优化模型的种子,并进行反复迭代,从而得到市级空间尺度和区县级空间尺度下某个运营商的市占率,本发明实施例中的运营商的市占率均为该优化之后的市占率,从而保证该市占率与统计区域对应的空间尺度保持一致,进而提高了统计的全量人口数量的准确性。
步骤S406,根据市占率,将有效号卡数进行扩样处理,以得到当前人口统计口径规则对应的运营商的全量终端用户数;
步骤S408,按照人口抚养比对全量终端用户数进行计量,以得到当前人口统计口径规则对应的全量人口数量。
进一步的,在图1的基础上,结合运营商开卡用户的年龄特征,本发明实施例提供了另一种基于终端信令数据的全量人口统计方法,图5为本发明实施例提供的另一种基于终端信令数据的全量人口统计方法的流程图,如图5所示,该方法包括以下步骤:
步骤S502,获取预先设置的人口统计口径规则,基于人口统计口径规则在运营商的数据库中查找对应的有效号卡数;
步骤S504,基于运营商的市占率,根据市占率对有效号卡数进行扩样处理,以得到运营商的全量终端用户数;
步骤S506,基于运营商的开卡用户的年龄特征,对全量终端用户数进行筛选,以得到指定年龄段的全量终端用户数;
具体地,在实际应用中,结合运营商的开卡用户的年龄特征,剔除不使用手机的老人和孩子,从而得到指定年龄段的全量终端用户数,这里,指定年龄段为15~64岁,即对得到的运营商的全量终端用户数,剔除大于等于65岁的大人和小于15岁的孩子用户,从而得到15~64岁的全量终端用户数。
步骤S508,获取校准后的终端普及率,根据指定年龄段的全量终端用户数得到指定年龄段的人口总规模数;
在实际应用中,对于工信部公布的各省级空间尺度的手机普及率并不能直接使用,主要是因为我国幅员辽阔,各地自然地理环境和人文地理环境差异巨大,这就导致即便同一个省级空间尺度,不同的城市和区县之间,手机普及率的差异性仍然很大,因此,我们很难使用省级空间尺度的手机普及率作为该省级空间尺度内所有市级空间尺度和区县级空间尺度的统一手机普及率;此外,由于流动人口的影响,某一市级空间尺度和区县级空间尺度内本地人持本地号卡的数量在逐步降低,因此,如果我们直接使用工信部公布的手机普及率,将会增大全量人口数量统计的误差;此外,不同年龄段拥有手机终端的概率也存在差异性,因此,为了提高全量人口数量统计的准确性,我们需要对终端普及率进行校准处理,以得到校准后的终端普及率。
具体地,本发明实施例通过构建数学模型对工信部公布的手机普及率进行调整优化,以得到校准后的终端普及率。具体方案如下:假定经济活动的发展与手机终端持有率之间,存在着正相关的关系,即经济活动越发达的地区,其手机普及率越高;但是,经济的发展与手机普及率之间并非线性关系,即经济发展到一定程度之后,在全民普及手机的情况下,手机终端的普及率会相对稳定,同样经济欠发达到一定程度后,不同区域之间的手机普及率也差异不大,因此,我们最终可以认为经济发展与手机普及率之间的关系为S型曲线。其中,Sigmoid函数作为机器学习领域常用的激活函数,其在工业界的实践效果,得到了公认,也是最为典型的S型曲线,且,传统的数据挖掘领域中逻辑回归也是采用该函数,因此,本发明实施例中,我们构建的数学模型最终定为Sigmoid函数。
确定上述数学模型为Sigmoid函数之后,我们还需搜集相关的数据,其中,经济发展最为直接的指标为GDP(Gross Domestic Product,国内生产总值)数据,该GDP数据可以通过统计年鉴进行获取,而典型城市的手机终端普及率,则可以通过实际调查访问,同时考虑人口流动、年龄段等因素确定;最后,我们可以通过Sigmoid函数进行模拟处理,得到GDP数据与手机普及率的函数关系,其中,函数关系图如图6所示,需要说明的是,由于原始GDP数据规模太大,因此本发明实施例在使用GDP数据时对原始GDP数据做了对数的处理。
因此,根据上述GDP数据与手机普及率的函数关系,我们可以得到指定年龄段的全量终端用户数。
步骤S510,利用人口抚养比对指定年龄段的人口总规模数进行计量,以得到当前人口统计口径规则对应的全量人口数量。
具体地,人口抚养比是指总体人口中非劳动年龄人口数与劳动年龄人口数之比,通常用百分比表示,以表明每100名劳动年龄人口大致要负担多少名非劳动年龄人口。在实际应用中,人口抚养比包括少儿抚养比和老年抚养比,具体计算采用:少儿人口(0~14岁)及老年人口(65岁及以上)之和与劳动年龄人口(15~64岁)之比。因此,我们可以利用人口抚养比对指定年龄段的全量终端用户数进行计量,从而得到当前人口统计口径规则对应的全量人口数量。
此外,如图7所示,对于统计出的全量人口数量,还需经过校验,即利用网上公布的数据或者第三方数据对全量人口数量进行校验,并将校验成功的全量人口数据进行归档和保存,以便于用于其他用途,本发明实施例对此不作说明。
进一步的,在上述实施例的基础上,本发明实施例还提供了一种基于终端信令数据的全量人口统计装置,图8为本发明实施例提供的一种基于终端信令数据的全量人口统计装置的示意图,应用于服务器,如图8所示,该装置包括:
获取模块10,用于获取预先设置的人口统计口径规则,基于人口统计口径规则在运营商的数据库中查找对应的有效号卡数;
处理模块20,用于基于运营商的市占率,根据市占率对有效号卡数进行扩样处理,以得到运营商的全量终端用户数;
计量模块30,用于按照人口抚养比对全量终端用户数进行计量,以得到当前人口统计口径规则对应的全量人口数量。
本发明实施例提供的基于终端信令数据的全量人口统计装置,包括:获取预先设置的人口统计口径规则,基于人口统计口径规则在运营商的数据库中查找对应的有效号卡数;基于运营商的市占率,根据市占率对有效号卡数进行扩样处理,以得到运营商的全量终端用户数;按照人口抚养比对全量终端用户数进行计量,以得到当前人口统计口径规则对应的全量人口数量。本申请缓解了现有技术中统计出的人口数量准确性较低以及传统入户调查代价高的问题,从而更加准确的对全量人口数量进行统计。
本发明实施例还提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例提供的基于终端信令数据的全量人口统计方法的步骤。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述实施例的基于终端信令数据的全量人口统计方法的步骤。
本发明实施例所提供的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (7)
1.一种基于终端信令数据的全量人口统计方法,其特征在于,应用于服务器,所述方法包括:
获取预先设置的人口统计口径规则,基于所述人口统计口径规则在运营商的数据库中查找对应的有效号卡数;其中,所述人口统计口径规则包括以下统计逻辑对应的人口统计口径规则:稳定人口、居住人口和工作人口;
基于所述运营商的市占率,根据所述市占率对所述有效号卡数进行扩样处理,以得到所述运营商的全量终端用户数;
按照人口抚养比对所述全量终端用户数进行计量,以得到当前所述人口统计口径规则对应的全量人口数量;
其中,所述按照人口抚养比对所述全量终端用户数进行计量,以得到当前所述人口统计口径规则对应的全量人口数量的步骤还包括:
基于所述运营商的开卡用户的年龄特征,对所述全量终端用户数进行筛选,以得到指定年龄段的全量终端用户数;
获取校准后的终端普及率,根据所述指定年龄段的全量终端用户数得到指定年龄段的人口总规模数;其中,通过构建数学模型对工信部公布的手机普及率进行调整优化,得到校准后的终端普及率;所述数学模型为Sigmoid函数,用于表征GDP数据与手机普及率的函数关系;
利用人口抚养比对所述指定年龄段的人口总规模数进行计量,以得到当前所述人口统计口径规则对应的全量人口数量;
所述基于所述人口统计口径规则在运营商的数据库中查找对应的有效号卡数的步骤包括:
获取统计区域和统计时段内的所述运营商的数据库的号卡总数;
基于人口统计口径规则,按照所述统计区域对应的空间尺度对所述号卡总数进行筛选,以得到当前统计区域内的有效号卡数;
所述按照所述统计区域对应的空间尺度对所述号卡总数进行筛选,以得到当前统计区域内的有效号卡数的步骤包括:
对筛选后得到的号卡数进行非人号卡剔除处理,以得到第一号卡数;
对所述第一号卡数进行去重处理,以得到所述有效号卡数;其中,所述去重处理包括网内一人多卡去重处理和网间一人多卡去重处理。
2.根据权利要求1所述的基于终端信令数据的全量人口统计方法,其特征在于,所述空间尺度为地级空间尺度,包括省级空间尺度、市级空间尺度、区县级空间尺度。
3.根据权利要求1所述的基于终端信令数据的全量人口统计方法,其特征在于,所述基于所述运营商的市占率,根据所述市占率对所述有效号卡数进行扩样处理,以得到所述运营商的全量终端用户数的步骤包括:
根据运营商的用户位置信息和通话关系数据推算得到所述运营商的市占率;
根据所述市占率,将所述有效号卡数进行扩样处理,以得到当前所述人口统计口径规则对应的所述运营商的全量终端用户数。
4.根据权利要求1所述的基于终端信令数据的全量人口统计方法,其特征在于,所述人口抚养比包括少儿抚养比和老年抚养比,所述指定年龄段为15~64岁。
5.一种基于终端信令数据的全量人口统计装置,其特征在于,应用于服务器,所述装置包括:
获取模块,用于获取预先设置的人口统计口径规则,基于所述人口统计口径规则在运营商的数据库中查找对应的有效号卡数;其中,所述人口统计口径规则包括以下统计逻辑对应的人口统计口径规则:稳定人口、居住人口和工作人口;
处理模块,用于基于所述运营商的市占率,根据所述市占率对所述有效号卡数进行扩样处理,以得到所述运营商的全量终端用户数;
计量模块,用于按照人口抚养比对所述全量终端用户数进行计量,以得到当前所述人口统计口径规则对应的全量人口数量;
其中,所述计量模块还用于:
基于所述运营商的开卡用户的年龄特征,对所述全量终端用户数进行筛选,以得到指定年龄段的全量终端用户数;
获取校准后的终端普及率,根据所述指定年龄段的全量终端用户数得到指定年龄段的人口总规模数;其中,通过构建数学模型对工信部公布的手机普及率进行调整优化,得到校准后的终端普及率;所述数学模型为Sigmoid函数,用于表征GDP数据与手机普及率的函数关系;
利用人口抚养比对所述指定年龄段的人口总规模数进行计量,以得到当前所述人口统计口径规则对应的全量人口数量;
所述基于所述人口统计口径规则在运营商的数据库中查找对应的有效号卡数包括:
获取统计区域和统计时段内的所述运营商的数据库的号卡总数;
基于人口统计口径规则,按照所述统计区域对应的空间尺度对所述号卡总数进行筛选,以得到当前统计区域内的有效号卡数;
所述按照所述统计区域对应的空间尺度对所述号卡总数进行筛选,以得到当前统计区域内的有效号卡数包括:
对筛选后得到的号卡数进行非人号卡剔除处理,以得到第一号卡数;
对所述第一号卡数进行去重处理,以得到所述有效号卡数;其中,所述去重处理包括网内一人多卡去重处理和网间一人多卡去重处理。
6.一种服务器,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1-4任一项所述的基于终端信令数据的全量人口统计方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述权利要求1-4任一项所述的基于终端信令数据的全量人口统计方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911188278.5A CN110992230B (zh) | 2019-11-27 | 2019-11-27 | 基于终端信令数据的全量人口统计方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911188278.5A CN110992230B (zh) | 2019-11-27 | 2019-11-27 | 基于终端信令数据的全量人口统计方法、装置及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110992230A CN110992230A (zh) | 2020-04-10 |
CN110992230B true CN110992230B (zh) | 2021-06-25 |
Family
ID=70087665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911188278.5A Active CN110992230B (zh) | 2019-11-27 | 2019-11-27 | 基于终端信令数据的全量人口统计方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110992230B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111651727B (zh) * | 2020-05-29 | 2023-09-26 | 京东城市(北京)数字科技有限公司 | 一种区域间整体人口转移量的计算方法及装置 |
CN117131335A (zh) * | 2023-10-23 | 2023-11-28 | 北京艾瑞数智科技有限公司 | 一种基于信令数据的人口分析方法及相关产品 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101394595A (zh) * | 2008-08-22 | 2009-03-25 | 中兴通讯股份有限公司 | 一种移动通信位置类业务中常住人员识别的方法及系统 |
US8504034B2 (en) * | 2010-11-09 | 2013-08-06 | Ntt Docomo, Inc. | System and method for population tracking, counting, and movement estimation using mobile operational data and/or geographic information in mobile network |
CN105101087A (zh) * | 2015-07-29 | 2015-11-25 | 郭今戈 | 基于位置区及实时通信的人流估算及趋势预测方法及系统 |
CN105488120B (zh) * | 2015-11-23 | 2018-11-23 | 上海川昱信息科技有限公司 | 基于手机大数据实时采集人口空间分布与大客流预警方法 |
JP6634511B2 (ja) * | 2016-03-30 | 2020-01-22 | 株式会社Agoop | 人口推定装置、プログラム及び人口推定方法 |
CN106709840B (zh) * | 2016-12-06 | 2020-09-15 | 上海云砥信息科技有限公司 | 一种基于移动网络数据的城市常住人口估算方法 |
CN107301467A (zh) * | 2017-04-11 | 2017-10-27 | 程在舒 | 中国未来人口数预测法 |
CN107635202A (zh) * | 2017-09-29 | 2018-01-26 | 青岛慧拓智能机器有限公司 | 基于acp方法和手机信令数据的平行监控分析系统及其方法 |
CN109165779B (zh) * | 2018-08-12 | 2022-04-08 | 北京清华同衡规划设计研究院有限公司 | 一种基于多源大数据与长短期记忆神经网络模型的人口数量预测方法 |
-
2019
- 2019-11-27 CN CN201911188278.5A patent/CN110992230B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110992230A (zh) | 2020-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110337059B (zh) | 一种用户家庭关系的分析算法、服务器及网络系统 | |
CN109982367B (zh) | 移动终端上网用户投诉预测方法、装置、设备及存储介质 | |
CN106488493B (zh) | 识别用户的网络热点类型的方法和装置及电子设备 | |
CN105007171A (zh) | 基于通信领域大数据的用户数据分析系统及方法 | |
CN109949063B (zh) | 一种地址确定方法、装置、电子设备及可读存储介质 | |
CN110992230B (zh) | 基于终端信令数据的全量人口统计方法、装置及服务器 | |
CN104424235A (zh) | 实现用户信息聚类的方法和装置 | |
CN112069281B (zh) | 兴趣点位置的确定方法、装置、计算机设备及存储介质 | |
CN112214677B (zh) | 一种兴趣点推荐方法、装置、电子设备及存储介质 | |
CN107203901A (zh) | 向用户推送产品信息的方法及装置 | |
CN114741612B (zh) | 一种基于大数据的消费习惯分类方法、系统和存储介质 | |
CN113111271A (zh) | 出行od数据扩样方法、装置、计算机设备及存储介质 | |
CN114881430A (zh) | 一种基于网络地图服务的社区生活便利度评价方法 | |
CN111143639A (zh) | 用户亲密度计算方法、装置、设备及介质 | |
CN113961780A (zh) | 常驻小区的获取方法、装置、电子设备以及存储介质 | |
CN111159576B (zh) | 一种用户分类方法、装置及系统 | |
CN111368858B (zh) | 用户满意度评估方法及装置 | |
CN114970495A (zh) | 人名消歧方法、装置、电子设备及存储介质 | |
CN112307075B (zh) | 用户关系识别方法及装置 | |
CN110677446A (zh) | 一种家庭群组用户的识别方法及装置 | |
CN116264706A (zh) | 5g基站布设评估模型训练方法、设备及存储介质 | |
Yuan et al. | A Multi‐Granularity Backbone Network Extraction Method Based on the Topology Potential | |
CN115271142A (zh) | 一种渠道选址方法、装置、电子设备及可读存储介质 | |
CN115696247A (zh) | 异常通信模式识别方法、装置、终端设备以及存储介质 | |
CN105897871A (zh) | 一种环境质量监控方法及装置、系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |